mrzaizai2k / News_mongo_redis

Store news and news summary with MongoDB and Redis

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

News_mongo_redis

Store news and news summary with MongoDB and Redis

Trello: https://trello.com/b/yiKSwU9w/data-engineering

  • docs: Cho word and slide
  • src: source code
  • config: config file .yaml
  • notebook: Là các file chứa example code

Mongo Atlas

https://cloud.mongodb.com/v2/65ca3ed0e555e205e6522116#/clusters/detail/Cluster0

Username: nhatanhhuynh1@gmail.com Password: HNA@nyu1204

Set up Redis

Reference:

  1. Cài docker

     docker run -d --name redis-stack -p 6379:6379 -p 8001:8001 redis/redis-stack:latest
     docker exec -it redis-stack redis-cli
     ping
     --> Ra Pong là ok
    
  2. Nhớ Run docker Redis mỗi khi cần dùng redis database

Tổng quan hệ thống

  1. Hệ thống crawl báo từ 2 nguồn Zing newsCafeF suwr dungj Beautiful Soup và Langchain
  2. Báo được lưu ở MongoDB với 5 thành phần: title, page_content, publish_date, authors, link
  3. Những Top news sẽ được tổng hợp nhờ model Falcon summary. Qua model summary, redis sẽ lưu thêm 1 trường dữ liệu là summary_text
  4. Top news sẽ hiển thị trên UI. Khi người dùng click vào, ta sẽ lấy báo từ redis, hoặc MongoDB

About

Store news and news summary with MongoDB and Redis

License:MIT License


Languages

Language:Jupyter Notebook 95.2%Language:Python 4.7%Language:Makefile 0.1%