論文サーベイ: SAM 系セグメンテーション
直近 10 本の要約 + 比較すべきベースライン + 落とし穴
論文サーベイ、既存リポジトリの整備、ノートブック修復、追加アブレーション、査読返答 — 後回しになりがちな研究開発タスクを、1 タスク 24-48 時間サイズに区切って月額キューで処理します。
1 タスク = 24-48 時間 (Pro) / 5 営業日 (Lite) で完了するサイズ ・ 月単位で停止・解約可
論文サーベイ: SAM 系セグメンテーション
直近 10 本の要約 + 比較すべきベースライン + 落とし穴
差分サーベイ: 拡散モデル (2026 年 2Q)
前月差分 / 補完系 / 制御性 軸
ノートブック修復 + Docker 化
動かない notebook → 推論バッチスクリプト + W&B ログ
査読返答: シード 3 本でアブレーション追加
指標表 + 図 1 枚差し替え
100+
件の R&D タスク納品
24-48 時間
1 タスクの完了サイズ (Pro)
PhD
全納品にレビュー
サービス
個別の研究開発タスクを月額サブスクリプションで受け切る設計。1 タスクごとの見積もり交渉や発注書発行は不要です。
ICLR / NeurIPS / CVPR / arXiv 論文のベースライン再現、既存リポジトリの動作確認、貴社データでの追試、アブレーション表の作成まで。README / Dockerfile / pyproject.toml / 乱数シード固定 / 実行ログ / 失敗条件 を含めて GitHub リポジトリで納品。
paperswithcode / arXiv / OpenReview / GitHub を追い、関連研究を「使うべき実装」「比較すべきベースライン」「怪しい主張」に整理。月次レポートに加えて、新着論文の差分だけを追う差分サーベイも対応。
放置された PoC、動かなくなったノートブック、手元でしか動かないスクリプトを、再実行可能なリポジトリに整理。データ前処理、推論のバッチ化、評価指標の実装、可視化、W&B / MLflow のログ整理まで対応。
流れ
Lite と Pro から選んで月額契約。クレジットカード or 請求書払い。違約金・縛りなし。
Notion キューに、論文 URL / 既存リポジトリ / 期待する評価指標 / データ形式 / 締切 を投げるだけ。1 タスク 24-48 時間 (Pro) または 5 営業日 (Lite) サイズに区切ります。
AI エージェントで探索・実装案・テスト生成を並列化し、シニアエンジニアが実験設計・コード品質・再現性をレビュー。途中で進捗を 1 度共有します。
GitHub リポジトリ + 環境固定 + 実行コマンド + シード + ログ + 既知の差分 を含めて納品。短い Loom 解説つき。同一目的内の改修は無制限。
1 タスクの実例
24-48 時間 (Pro) または 5 営業日 (Lite) で完了する単位を 1 タスクと呼びます。それより大きい案件は、複数タスクに分割して順に処理します。
1 タスクで完了する例
複数タスクに分割する例
初回相談で「何タスクに分割するか」「どの順で処理するか」を一緒に整理します。
料金
研究エンジニアを正社員 (年 ¥1,000 万級) で雇うほどではないが、詰まりやすい実装キューを月額で動かしたいチーム向け。
Lite
¥350,000 / 月 (税別)
月数件のサーベイ / リポジトリ整備 / 軽い実装を外に出したい研究室・小規模 R&D チーム向け。
Pro
¥550,000 / 月 (税別)
アブレーション・査読対応・PoC を 24-48 時間サイクルで回したい CTO / PI 向け。
年一括払いは 15% 割引。「改修無制限」は同一タスクの目的範囲内。新規実験 / 新規論文 / 別データセットは別タスクとして扱います。
納品の考え方
初回は論文 / リポジトリ / データセット / 評価指標を確認し、再現計画とリスクを共有します。最終納品は GitHub リポジトリに 環境固定・実行コマンド・シード・ログ・既知の差分 を含めます。
論文側の不備や未公開の前処理で再現できないことは現実に起こるため、その場合は 「再現できた範囲 / 差分 / 原因仮説」 まで明記して納品します。
frogiraffe / rnd を選ぶ理由
LLM コーディングで骨格は出る。データ前処理、評価指標のズレ、GPU 実行、シード差、論文記述との齟齬で止まる部分を引き受けます。
数式の読み違い、実験設定、評価指標、ベースラインの妥当性を確認。論文採択を保証するものではなく、研究実装の品質確認です。
シード固定、Docker / uv / pyproject.toml、データセットのハッシュ、実行コマンド、主要ログを標準で残します。「担当者の手元では動く」を納品にしません。
PyTorch / JAX / TensorFlow / scikit-learn / Hugging Face / Lightning / MONAI / W&B など、既存リポジトリの流儀に合わせて実装します。
日本語の論文・仕様書・社内 Wiki を直接読み、日本時間で対応。海外オフショアにはない速度感。
秘密保持契約 (NDA) を標準締結。納品コード・モデルの著作権は依頼主に帰属。frogiraffe 側では再利用しません。
FAQ
24-48 時間 (Pro) または 5 営業日 (Lite) で完了する単位を 1 タスクと呼びます。例: 論文 1 本のサーベイ / 既存リポジトリの動作確認 + README 整備 / 動かないノートブックの修復 / シード 1〜3 本のアブレーション追加 + 表 1 枚 / 差分サーベイ 1 本 / 査読返答用の追加実験 1 本。論文の完全再現や新規データセットでのファインチューニングは、複数タスクに分割して順に処理します。
再現できた範囲、差分、原因仮説、追加検証案を明記して納品します。データ分割、前処理、未公開のハイパーパラメータ、実装差分が原因になりやすいので切り分けます。「完全再現できないからゼロ納品」にはしません。
可能です。既存ブランチ、エラーログ、期待する評価指標、動かしたい環境を共有してください。動かなくなったノートブック / スクリプトの整理から対応します。
コンピュータビジョン、自然言語処理、生成モデル (拡散・LLM・自己回帰)、強化学習、表現学習、テーブルデータ、エージェント系のワークフロー、MLOps、データエンジニアリング。物理シミュレーションや純粋数学、医療診断・与信判断のような規制判断単体は対象外です。
frogiraffe の PhD エンジニア + AI エージェント (Claude Code / Cursor 等) のハイブリッド。実験設計、コード品質、評価指標の妥当性は必ず人がレビューします。
Notion 上の共有キューに依頼を書いていただきます。Slack 常駐や 1on1 同期はサービス範囲外です (非同期で完結する設計)。仕様の曖昧な点はこちらから確認します。
実データへのアクセス権が不明な案件、ライセンス違反が疑われるモデル / データセット利用、成果保証型のテーマ探索、論文採択保証、医療・金融などで規制判断が必要な業務単体は対象外です。
いつでも。月末締めで翌月から反映。違約金や縛りはありません。Lite と Pro の切替も自由です。
納品物の著作権はすべて依頼主に帰属。frogiraffe 側で複製・転用はしません (NDA で担保)。
30 分の無料相談で、手元の R&D タスクを 1 タスク単位にどう切り出せるか、Lite と Pro のどちらが合うかを整理します。
※ 本ページは smoke test 段階のため、フォーム連携 (Tally / Cal.com) は順次追加します。