johtaniが個人的に検索エンジンの利用方法などを調べるための個人プロジェクトのリポジトリ。 ベクトル検索などを試す予定です。
おもにPythonを利用します。
python3 -m venv .venv
source .venv/bin/activate
pip install poetry
poetry install --no-root
AmazonのShopping Queries Datasetを利用します。 なお、esci-dataの中のparquetのデータは1GB以上あるので、git-lfsを利用してcloneする必要があります。 手元の環境にgit-lfsがインストールされていることを確認してください。
git clone https://github.com/amazon-science/esci-data.git
shuttie/esci-s: Extra product metadata for the Amazon ESCI datasetも利用予定です。
- [TODO]インストール、起動方法など未検討
- Elasticsearch
- OpenSearch
- Vespa
- Apache Solr
- Weaviate
- Qdrant
MITライセンス