feat: フロントエンドでのPDFパース
kyonenya opened this issue · comments
kyonenya commented
なぜ node_modules のファイルを手動でアプリにコピーしなければならないのですか?
PSPDFKit はバンドルに依存しません(フレームワークに依存しないのと同じ理由です)。実際、バンドルなしで使用することもできますし、PSPDFKit のアセットは link タグや script タグで参照できます。
さらに、コードベースを複数のファイルに分割することで、特定の部分が遅延ロードされるようにしています。単一のファイル・バンドルを提供すると、そのサイズは非常に大きくなり、ほとんどの場合、これは受け入れられません。
メインのエントリーポイントであるpspdfkit.jsは通常、ツールによって自動的にバンドルされます。しかし、pspdfkit-libの追加アセットについては、ホストアプリケーションが遅延ロードされていることに気づかないため、手動でコピーする必要があります。
Common Issues | PSPDFKit
- pdf.jsを使って日本語ファイルを表示する - Qiita
- TypeScriptでpdfからテキストを抽出する(PDF.js)
pdfjsもブラウザ側でgetDocumentsできてるぞ- PSPDFKit とかいう新しめの誰も使ってないライブラリがある。フロントエンドで動くしレガシーじゃない
- ↓とか見てもPDFのパースをLangchainでやる必要はないと分かる。自前でやればいい
- PDFに質問しよう (前編: PDF Upload & Embedding)
- How to Extract Text from a PDF Using PDF.js and JavaScript | PSPDFKit
- JavaScript PDF Parser Library | PSPDFKit SDK
- Open & Display PDF from Blob Using JavaScript | PSPDFKit SDK