SREドメインで国内トップクラスの実績を築いた当社は、データ基盤やDBREを経て、生成AI・機械学習モデルの開発・運用支援を本格化するフェーズに至りました。 直近、NVIDIA Inception プログラムに採択され、最新GPUハードウェア・CUDA環境へのアクセス、Deep Learning Institute(DLI)研修など、AI開発に特化した豊富な特典を獲得しています。 現在、大手クライ…
給与
750万〜1,500万円
勤務地
◎フルリモート勤務可能
勤務形態
出社
応募方法
相談受付中
募集情報
仕事内容
募集背景
SREドメインで国内トップクラスの実績を築いた当社は、データ基盤やDBREを経て、生成AI・機械学習モデルの開発・運用支援を本格化するフェーズに至りました。 直近、NVIDIA Inception プログラムに採択され、最新GPUハードウェア・CUDA環境へのアクセス、Deep Learning Institute(DLI)研修など、AI開発に特化した豊富な特典を獲得しています。
現在、大手クライアントを中心に、Google Cloud Gemini / Vertex AI・AI Platformを 活用した生成AI導入支援・機械学習モデルの本番運用支援が急増しています。 モデルを「作る」だけでなく「本番環境で動かし続ける」MLOps視点を持つエンジニアを募集します。
▶▶▶ [Sreake紹介スライド(事業内容、取り組み)](https://speakerdeck.com/3shake/3shake-sreake-deck)
仕事内容
モデル開発・実装
NeMoを用いたLLM・画像/音声モデルのファインチューニング・カスタマイズ
(LoRA・RAG・RLHFなど)
NIM での推論マイクロサービス設計・実装・パフォーマンス最適化
Python/PyTorch を中心としたモデル開発・評価・改良サイクルの推進
論文・Kaggle上位解法・OSS を調査し、プロダクトレベルで実装
本番運用・MLOps
Kubeflow・Vertex AI・MLflowなどを活用したMLパイプライン構築・自動化・継続的デプロイ
本番モデルのパフォーマンス監視・ドリフト検知・再学習トリガーの設計・運用モデルの推論品質・レイテンシ・コストのモニタリング基盤構築
(Prometheus・Grafana・OpenTelemetry との連携)
SREチームと連携したMLシステムの信頼性・可用性向上
(SLI/SLO定義、インシデント対応)
改善サイクル・ナレッジ共有
生成AIを活用した開発プロセスの高度化・自動化の推進
プロジェクトで得られた知見のドキュメント化・社内勉強会・RAG化
技術ブログ・カンファレンス登壇・OSS コントリビュート(希望者)
※インフラ専任SREが別に在籍しており、MLOps基盤のインフラ部分はSREと協業します。
MLエンジニアは「使いこなす・改善する・監視する」スタンスで、本来のMLドメインに
集中できる環境です。
仕事の魅力
国内トップクラスのクライアントのAI基盤構築・本番運用に最前線で関われる
NVIDIA Inception採択により、最新GPU環境・DLI研修など、AI開発に特化したリソースを活用できる
SREのエキスパートとの協働で「MLOpsを分かるMLエンジニア」「推論サービスの信頼性を語れるMLエンジニア」という市場希少なポジションを確立できる
モデルを「作って終わり」ではなく、本番環境での運用・監視・改善サイクル全体に関与できる
伴走型コンサルティングにより、クライアントの内製化・競争力強化に直接貢献できる
(SIer・SESとは異なるスタイル)
AI駆動開発ツール(Claude・Cursor・Devin・Gemini等)を積極活用する開発文化
エンジニア職・非エンジニア職が互いを尊重し合う協力的な雰囲気
開発環境
パブリッククラウド: AWS, Google Cloud
開発言語: Go, Python, JavaScript, TypeScript など
IaC: Terraform, Helm, Ansible など
コンテナオーケストレーション: Kubernetes(GKE, EKS)
サービスメッシュ: Istio
バージョン管理 / CI/CD: GitHub, GitLab, GitHub Actions, Argo CD など
モニタリング / オブザーバビリティ: Datadog, Prometheus, Grafana, OpenTelemetry, Amazon CloudWatch, Cloud Monitoring, Cloud Logging, Elastic Stack など
インシデント管理: PagerDuty
生成AI: GitHub Copilot, Claude, Cursor, Devin, Gemini など
その他: Jira, Slack, Notion
マシン: MacBook Pro (14 inch) ※WindowsOS PCも選択可
※あくまで一例です。参画するプロジェクトによって異なる場合があります。
必須要件
機械学習・深層学習に関する開発または研究の経験
PyTorch・TensorFlow などの機械学習・深層学習フレームワークの実装経験
Pythonでの実装経験(データ処理・モデル学習・API連携など)
歓迎要件
LLM・生成AIモデルのファインチューニング・推論最適化の経験
CUDA/Triton 等 GPU プログラミングの経験
Kubeflow/MLflow/Vertex AI などでのMLパイプライン構築・運用経験
本番モデルのパフォーマンス監視・ドリフト検知・再学習パイプラインの設計・運用経験
Prometheus・Grafana・OpenTelemetry等を用いたMLシステムのモニタリング経験
IaC(Terraform/Helm)+ GitOps(Argo CD 等)の利用経験
SRE・DevOpsの概念への理解・関心
英語での論文リーディング・技術コミュニケーション
求める人物像
モデル開発から本番運用・監視・改善サイクルまで一気通貫で関与し、自ら改善を推進できる方
SREチームや顧客エンジニアと連携しながら、AI基盤を協働で構築・改善できる方
MLOps・モデル監視・信頼性工学(SRE)に強い関心を持つ方
[ミッション・ビジョン・バリュー](https://3-shake.com/about/)に共感頂ける方
活躍イメージ
入社後半年〜1年:
顧客のAI案件に参画し、モデル開発〜本番デプロイ〜監視・運用の一連のサイクルを担える状態。 SREチームとの連携も自走できる。
1〜2年以降:
ML×SRE視点を持つアーキテクトとして、顧客から直接指名される存在に。
AI基盤の設計・MLOpsパイプラインの構築をリードし、組織目標(ナレッジ共有・AI活用推進)への貢献も期待。
会社紹介
株式会社スリーシェイクは、代表の吉田をはじめ、SREコンサルティングやデータ活用基盤など、ITインフラ領域の技術力に強みを持つメンバーを中心に構成されたテックカンパニーです。
現在、中長期視点での事業拡大に向けて、組織拡大の下地を作っております。
■ 社会の根幹となるようなサービスを出し続ける
私達スリーシェイクの社名の由来はネットワーク接続技術の基本である「3 way handshaking」。
インターネットの根幹を支えるこの技術のように、社会の根幹となるイノベーティブなプロダクトを連続的に生み出し、世界の進歩を加速させていきたい。
そんな想いで、事業やサービスの開発・改善に取り組んでいます。
■ 世の中になくてはならない企業になることを目指して
私たちは毎年2ケタ以上の成長を遂げていますが、現状に満足してはいません。
私たちの生活に欠かせない、社会の根幹となる新たなプロダクトを生み出すべく、日々構想しています。
世の中になくてはならない企業となるために、コツコツと成果を積み上げながらも、全力で挑戦していきます。
■ Googleテックパートナーに認定! / 参入障壁の高い、高度なインフラ技術が強み
スリーシェイクは技術的に難しいインフラ技術のテンプレート化を実現したことにより、お客様ごとにカスタマイズを必要としない、汎用性の高いプロダクトを生み出すことに成功しています。
また、客先で必要となるミドルウェアやデータベースも社内で1から10まで内製することで、導入までのリードタイムを短縮し、低コストで柔軟なクラウド環境構築を叶えています。
その結果、Reckonerが日本で3番目となるGoogle社のテックパートナーに認定され、Googleからの販売支援も受けています。
スリーシェイクをより詳しく知りたい方はこちら
▽▼▽スリーシェイク採用情報ページ▽▼▽
[https://jobs-3-shake.com/](https://jobs-3-shake.com/)
事業内容
スリーシェイクは「企業経営のインフラ(エンジニアリング)を支えるプラットフォーム」として、4つの事業を展開しています。
◆ SRE技術支援サービス事業「[Sreake](https://sreake.com/)」
弊社の主力事業であり、SRE( Site Reliability Engineering )の導入・実践に向けた日本初の伴走型コンサルティングサービス。
金融、製造、小売、AI、メディアなど、技術力が求められる領域で、Google 社の提唱する SRE の考え方に基づき、クラウドネイティブな技術導入、開発/運用プロセスの支援をしています。
AWS, Google Cloud, Kubernetes, Observability, DBRE, MLOps などの最新技術の知見を集約。
文化も含めた「インフラ」を整備し、企業の SRE 内製化をゴールとして活動します。
◆ クラウド型データ連携プラットフォーム事業「[Reckoner](https://reckoner.io/)」
クラウド型データ加工・連携プラットフォームです。
デジタル化に伴うデータ活用、業務自動化ニーズに向けて、データ活用/業務最適化の課題を非エンジニアでも使いこなせるノーコード基盤で解決します。
◆ 脆弱性診断SaaS事業 「[Securify](https://www.securify.jp/)」
複雑化するサイバー攻撃に対して事業者が抱えるセキュリティリスクを無くすために、簡単操作で高性能なセキュリティチェックが実現できるプラットフォームです。
◆ エンジニア組織特化型HRパートナー「[Relance](https://relance.jp/)」
テックカンパニーが手がけるHR支援サービスです。
フリーランスの個人アサインからチーム提供、採用コンサルティングから
正社員紹介まで、エンジニア組織の内製化を一貫して支援します。
募集情報
福利厚生・待遇
交通費支給(当社規定による)
各種資格取得支援
社内図書購入制度
社内飲食補助
フリースナック
定期健康診断(年1回)
インフルエンザ予防接種(会社負担)
法定福利厚生各種(産休、育休など)