主に帳票向けAI-OCR*1のモデル改良やリリース関連、新規技術の調査・検証の作業を担当しています。
モデル改良では、主にアノテーション作業*2やアノテーションデータを用いてモデルの学習・精度の評価を担当し、リリース関連ではモデル・ミドルウェアの更新、製品開発やインフラなど他部署との連携・共有などをおこなっています。
新規技術の調査・検証作業では、最新のアルゴリズムの情報などを集めて実際にデータを使って学習・評価を行い、精度が良かった手法については実際のサービスに組み込めないか実現可能性を探っています。
最近は生成AIやLLMも含めて日々新しい技術・アルゴリズムが発表されていますので、
それらの動向も注視しながら、サービスにとって最善な手法を日々考えることを意識しており、チームリーダーや他部署の開発担当とも議論しながら開発を進めています。
ラクスのAIエンジニアとしてやりがいを感じるのは、新規にアノテーションしたデータを使って学習・評価した結果、AIモデルの精度が上がることです。
また、リリース後サービスとして稼働しているものを見た際に達成感を感じます。
アルゴリズムや手法の調査・検証を進める中で新しく得られる知識も多く、チームリーダーや他チーム・他部署の方の技術レベルが非常に高いので、日々刺激を感じながら楽しんで開発をしています。
*1…AI-OCR:Deep Learningを用いて、画像データに含まれる文字を自動的に認識し、テキストデータとして抽出する技術。
*2…アノテーション:画像中の物体の種類や座標などの情報をラベルとして画像に関連づける作業。主に教師あり学習に使用される。