生成AI開発データ作成 (FastLabel株式会社)

サービス紹介
生成AI開発のためのデータ不足を解消する プロフェッショナルサービス
事前学習のための画像・動画・音声・テキストデータ提供及び加工
お客様のご用件・ご要望に合わせて学習データ素材の提供が可能です。
AI開発へ利用承諾済のデータセット販売、新規撮り下ろし・収集により、必要なデータの拡充を実現します。
図表付きドキュメントのQAに関する教師データの作成も可能です。
専門人材による生成AI学習データ作成
生成AI開発においては、いかに「専門性の高いデータ」を作成し学習させられるかが、競合企業との差別化要因になります。
FastLabelは、プロジェクトの企画から、専門人材のマネジメントを含むデータの収集・作成までご支援し、高品質なデータ作成を実現します。
RAG用データ作成
社内マニュアルをRAGデータとして書き起こすことができます。
社内に不足しているデータは、公共機関が発行するパンフレット/レポートや論文など、図表を含むドキュメントからの収集も可能です。
3つのポイント
【1】高品質なデータ収集・販売
「事前学習のためのデータが不足している」という課題に対応。連携パートナー(データの権利保持者)の公式データを基に収集。Web検索等では入手しづらい、情報源が明らかで正確なデータを提供しています。
専門人材による生成AI学習データ作成
データ権利者や被写体・被写物などの許諾を得た、著作権、肖像権、個人情報保護など法的にリスクのないデータのみを提供しています。
安心・安全な権利クリアなデータ
データ権利者や被写体・被写物などの許諾を得た、著作権、肖像権、個人情報保護など法的にリスクのないデータのみを提供しています。
事前学習のための画像・動画・音声・テキストデータ提供及び加工
LLM向け長文テキストデータ
LLMの事前学習のため、有料記事を配信するWebメディアなどから、権利クリアなテキストデータを調達できます。
単に「権利フリーな高品質テキスト」だけではなく、「欲しい知識が含まれたテキスト」をご提供可能です。
VLM向け画像データ
テーマ特化型のメディア・情報誌から、VLMの事前学習のための権利クリアな画像データを調達できます。
記事のテキストデータやグラフ等を活用したチューニングデータを作成することも可能です。
高品質画像・動画データ
日本のストックフォトサービスと業務提携しており、2億以上の画像、2百万以上の動画のライブラリの中から用途に適したデータを短納期でご提供しています。
また、FastLabelにてVLMの要件に応じた画像・動画の選定や、学習データとして利用するためのキャプション付与等のデータ作成も実施しています。
音声データ
音声データの収集からアノテーションまでご支援します。プロジェクトの要件を踏まえて、人材・機材・環境の手配が可能です。
音声現場に赴いての収録、スタジオを整備しての高品質な音声収録など、さまざまなご要望に柔軟に対応いたします。
また、パートナーであるポッドキャストプラットフォームを通じて、権利クリアな音声データセットを調達できます。
300以上のポッドキャストが揃っており、幅広いジャンルから自社の用途に適した音声データを選べます。
専門人材による生成AI学習データ作成
生成AI開発においては、いかに「専門性の高いデータ」を作成し学習させられるかが、競合企業との差別化要因になります。
当社は、プロジェクトの企画から、専門人材のマネジメントを含むデータの収集・作成までご支援し、高品質なデータ作成を実現します。
RAG用データ作成
図表付きドキュメントのQAに関する教師データの作成や、図表をRAGデータとして書き起こすことができます。
社内に不足しているデータは、公共機関が発行するパンフレット/レポートや、グラフ資料、論文など図表を含むドキュメントからの収集も可能です。
ご契約〜納品までの流れ
お客様のフェーズに合わせて最適なサービスをご提案いたします。まずはお気軽にお問い合わせください。
- 案件概要ヒアリング
- お見積り算出
- プロジェクト開始
- 納品、検収
お客様の声
作業内容の性質上、細かな要件定義が難しかったのですが、お伝えした目標感を踏まえて作成フロー・内容を主体的に提案・調整いただけたので、とても助かりました。作業スピードは迅速で、完成したデータは非常に高品質でしたので、とても満足しています。早速、研究開発におけるデータ利用を進めています。
提供会社
FastLabel株式会社