bob-blob / elasticsearch-analysis-morphology

Плагин русская морфология для ElasticSearch (8.6.0)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

elasticsearch-analysis-morphology

Плагин для ElasticSearch (8.4.1) реализующий анализатор для русского и английского языка, используются словари проекта http://aot.ru Оригинальный плагин взят отсюда https://github.com/imotov/elasticsearch-analysis-morphology который в свою очередь использует russian_morphology и english_morphology от проекта Russian Morphology for Apache Lucene https://github.com/AKuznetsov/russianmorphology Плагин добавляет два analyzers и token filter: "russian_morphology" и "english_morphology"

Elasticsearch

При создании индекса указываем настройки с указанием анализатора и создаем на основе настроек маппинг. Пример

PUT /products
{
    "settings": {
        "index": {
            "analysis": {
                "analyzer": {
                    "product_name_analyzer": {
                        "type": "custom",
                        "tokenizer": "standard",
                        "filter": [
                            "lowercase",
                            "search_synonym",
                            "russian_morphology",
                            "english_morphology",
                            "ru_stopwords"
                        ]
                    }
                },
                "filter": {
                    "search_synonym": {
                        "ignore_case": "true",
                        "type": "synonym",
                        "synonyms": [
                            "bosch,бош"
                        ]
                    },
                    "ru_stopwords": {
                        "type": "stop",
                        "stopwords": "а,без,более,бы,был,была,были,было,быть,в,вам,вас,весь,во,вот,все,всего,всех,вы,где,да,даже,для,до,его,ее,если,есть,еще,же,за,здесь,и,из,или,им,их,к,как,ко,когда,кто,ли,либо,мне,может,мы,на,надо,наш,не,него,нее,нет,ни,них,но,ну,о,об,однако,он,она,они,оно,от,очень,по,под,при,с,со,так,также,такой,там,те,тем,то,того,тоже,той,только,том,ты,у,уже,хотя,чего,чей,чем,что,чтобы,чье,чья,эта,эти,это,я,a,an,and,are,as,at,be,but,by,for,if,in,into,is,it,no,not,of,on,or,such,that,the,their,then,there,these,they,this,to,was,will,with"
                    }
                }
            }
        }
    },
    "mappings": {
        "properties": {
            "name": {
                "type": "text",
                "analyzer": "product_name_analyzer"
            },
            "code": {
                "type": "keyword"
            },
            "description": {
                "type": "text",
                "analyzer": "product_name_analyzer"
            },
            "brand": {
                "type": "keyword"
            }
        }
    }
}

Dockerfile

Образ оригинального elasticsearch 8.4.1 с шагом установки плагина analysis-morphology

Maven

тесты не реализованы, собирать mvn clean package -Dmaven.test.skip=true и далее копировать полученный /target/releases/elasticsearch-analysis-morphology-8.4.1.zip в существующий кластер и устанавливать через bin/elasticsearch-plugin install file:elasticsearch-analysis-morphology-8.4.1.zip

About

Плагин русская морфология для ElasticSearch (8.6.0)

License:Apache License 2.0


Languages

Language:Java 96.1%Language:Dockerfile 3.9%