komiya-atsushi / search-research

検索エンジンなどの調査用リポジトリ

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

検索エンジンなどの調査用リポジトリ

johtaniが個人的に検索エンジンの利用方法などを調べるための個人プロジェクトのリポジトリ。 ベクトル検索などを試す予定です。

setup

おもにPythonを利用します。

python3 -m venv .venv
source .venv/bin/activate
pip install poetry
poetry install --no-root

データについて

AmazonのShopping Queries Datasetを利用します。 なお、esci-dataの中のparquetのデータは1GB以上あるので、git-lfsを利用してcloneする必要があります。 手元の環境にgit-lfsがインストールされていることを確認してください。

git clone https://github.com/amazon-science/esci-data.git

shuttie/esci-s: Extra product metadata for the Amazon ESCI datasetも利用予定です。

対象検索エンジン

  • [TODO]インストール、起動方法など未検討

対応済み

  • Elasticsearch

対応予定?

  • OpenSearch
  • Vespa
  • Apache Solr
  • Weaviate
  • Qdrant

データの準備

License

MITライセンス

About

検索エンジンなどの調査用リポジトリ

License:MIT License


Languages

Language:Jupyter Notebook 63.5%Language:Python 36.5%