
pymupdfによるPDFデータ抽出ハンズオン
はじめに お仕事で、生成AIを用いてPDF(非構造化データ)から構造化データの抽出に取り組んでいます。 従来のAI OCRでは、表組みや複雑なレイアウトを持つPDFからの情報抽出に課題がありました。そこで、Pythonの... » read more
はじめに お仕事で、生成AIを用いてPDF(非構造化データ)から構造化データの抽出に取り組んでいます。 従来のAI OCRでは、表組みや複雑なレイアウトを持つPDFからの情報抽出に課題がありました。そこで、Pythonの... » read more
はじめに 先日、RAG(Retrieval Augmented Generation)に関する勉強会で、LangChainを利用したRAGの回答精度を評価するツール「Ragas」の話を聞きました。 生成AIが作成する結果... » read more
はじめに 最近は、AWSよりGoogleCloudの構築がもっぱらな稲村です。 仕事の中でも生成AIを活用した案件に参加しているので、チーム内で会話したことなどをまとめてLTを行いました。 登壇資料 URL:Speake... » read more
はじめに 会社の人数が増えるに従い、ブログ投稿数も増加して見落としが多くなってきました。 そのため毎朝自分のスマートフォンのLINEに、AIモデルを活用して、ブログの重要なポイントを効率よく通知する仕組みをつくってしまお... » read more
はじめに 生成AIの利用が進む中、Retrieval Augmented Generation(以下、RAG)の活用が注目されています。 RAGは、事前にベクトルデータベース(ベクトルDB)に専門的な背景情報を格納し、そ... » read more
はじめに 先日 RAG(Retrieval Augmented Generation)に関するLTで「チャンクごとにベクトルDBに埋め込まれる」という話を聞いたので、Streamlitを使って可視化をしてみました。 RA... » read more
はじめに 生成AI等の検証を簡単に容易でいる環境が欲しいと思い、「Amazon SageMaker Studio コードエディタ」を利用する方法があったので、環境構築のための手順を公開します。 Amazon SageMa... » read more
はじめに 2024年12月21日(土)、協栄情報(以下、CPI)クラウド事業本部主催の 第3回勉強会 を開催しました! 第3回目の勉強会は「re:Invent」の re:Cap LTと、アンケートで要望が多かった「チーム... » read more
はじめに こんにちは!クラウド事業本部のいなむら(INAMURA)です。 Amazon Bedrock Data Automation(以降、BDA)がリリースされました。 こちらは非構造化データを効率的に処理し、インサ... » read more
はじめに 2024年12月12日(木)、協栄情報(以下、CPI)クラウド事業本部主催の 第2回勉強会 を開催しました! 第2回目の勉強会は12/1 – 12/5に開催されていたAWS「re:Invent」に参... » read more
はじめに こんにちは、クラウド事業本部の稲村です。AWS re:Invent 2024にソロ参加してきました。 10年ぶりの海外となりアメリカ本土自体初上陸で、そもそも「アメリカのラスベガスってどんなところ?」や「re:... » read more
はじめに こんにちは、クラウド事業本部の稲村です。AWS re:Invent 2024にソロ参加してきました。 10年ぶりの海外となりアメリカ本土自体初上陸で、ツアーパックでの参加と言えどソロ旅行のようなもので、AWSの... » read more