株式会社モルフォAIソリューションズ、LLM向けの日本語データセット生成サービスを提供開始
株式会社モルフォAIソリューションズ以下 モルフォAIS)は12月19日、日本語LLM(Large Language Model:大規模言語モデル)の学習データを生成するための、AI-OCR(Optical Character Recognition:光学文字認識)出力サービスの提供を開始した。
このサービスは、独自LLMの構築を検討されている組織(企業・官公庁・地方自治体等)やLLM開発を進めるAI企業・研究機関向けに正確で多様な日本語テキストデータを提供。
概要
<サービス内容>
既存文書(社史・広報誌・公文書・議事録等)のデジタル化とLLM学習データへの変換
<特徴>
①帳票ではなく、文書に対応したAI-OCR
– LLMに入力する際に重要な読み順まで再現
– 文字種は約7000種類で、複雑な漢字も読み取り可能
②画像(JPEG,PDF,PNG等)が含まれている雑多な文書を、テキスト(様々なフォーマット)で出力可能
<リンク>
https://prtimes.jp/main/html/rd/p/000000097.000064140.html
投稿者プロフィール
最新の投稿
おすすめ記事Recommended Articles
-
年末年始にWeb広告を配信するメリットとは?おすすめ業界もご紹介
2023.11.02 WEBマーケティング -
インフルエンサーマーケティングとは?メリット・デメリットや注意点
2023.04.20 WEBマーケティング -
Google検索結果から削除したい!サーチコンソールで素早くページを削除する方法
2021.11.12 WEBマーケティング -
リスティング広告のターゲット選定方法を解説!
2021.04.03 WEBマーケティング -
リスティング広告の予算はどう決めればいいの?
2021.04.02 WEBマーケティング -
消費税総額表示義務、ネット広告・アフィリエイト広告のチェックポイント
2021.03.07 WEBマーケティング
DXニュースについてABOUT DX NEWS
デジタルトランスフォーメーションを推進するにあたって参考となる国内外の事例、
デジタルマーケティングを自社内で行うインハウス化に関するお役立ち情報を提供しています。