robertofortes23 / searchable-repository

Modelo do AWS SAM que implanta um aplicativo sem servidor. Esse aplicativo usa serviços do Amazon ML, como Comprehend e Rekognition, para indexar documentos e imagens e, em seguida, envia os resultados ao Elasticsearch para indexação rápida.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Sobre o Projeto

Este repositório contém um modelo do AWS SAM que implanta um aplicativo sem servidor. Esse aplicativo usa serviços do Amazon ML, como Comprehend e Rekognition, para indexar documentos e imagens e, em seguida, envia os resultados ao Elasticsearch para indexação rápida.

Requisitos

Instruções de instalação

  1. Crie uma conta da AWS se ainda não tiver uma e faça login.

  2. Clone o repositório em sua máquina de desenvolvimento local usando git clone.

  3. E execute:

sam build
sam deploy --guided

Siga os prompts no processo de implantação para definir o nome da pilha, a região da AWS, os nomes de bucket exclusivos, o endpoint de domínio do Elasticsearch e outros parâmetros.

Como funciona

  • Carregue um arquivo PDF, DOCX ou JPG para o bucket de Documentos de destino.
  • Após alguns segundos, você verá que o índice no Elasticsearch foi atualizado com rótulos e entidades para o objeto.

Estrutura de Arquivos

├── addToQueueFunction <-- Código fonte para uma função lambda
│ └── app.js <-- Manipulador principal do Lambda
│ └── package.json <-- dependências e scripts do NodeJS
├── batchingFunction <-- Código fonte para uma função lambda
│ └── app.js <-- Manipulador principal do Lambda
│ └── package.json <-- dependências e scripts do NodeJS
├── addToESindex <-- Código fonte para uma função lambda
│ └── app.js <-- Manipulador principal do Lambda
│ └── package.json <-- dependências e scripts do NodeJS
├── processDOCX <-- Código fonte para uma função lambda
│ └── app.js <-- Manipulador principal do Lambda
│ └── package.json <-- dependências e scripts do NodeJS
├── processJPG <-- Código fonte para uma função lambda
│ └── app.js <-- Manipulador principal do Lambda
│ └── package.json <-- dependências e scripts do NodeJS
├── processPDF <-- Código fonte para uma função lambda
│ └── app.js <-- Manipulador principal do Lambda
│ └── package.json <-- dependências e scripts do NodeJS
├── template.yaml <-- modelo SAM

Esta arquitetura segue o modelo criado pelo James Beswick, disponível em https://aws.amazon.com/pt/blogs/compute/creating-a-searchable-enterprise-document-repository/

About

Modelo do AWS SAM que implanta um aplicativo sem servidor. Esse aplicativo usa serviços do Amazon ML, como Comprehend e Rekognition, para indexar documentos e imagens e, em seguida, envia os resultados ao Elasticsearch para indexação rápida.

License:MIT No Attribution


Languages

Language:JavaScript 100.0%