dahsie's repositories
anomalie_detection
Ce projet est réalisé dans le cardre de mon projet académique de fin de cursus ingénieur informatique en data science. L'objectif est de réalisé la détection d'anomalie qui sont de types varié en utilisant les machine learning et le deep learning
challenge_learning
L'objectif de ce challenge est de proposer une méthode de classification, basée sur des réseaux de neurones, permettant de classer des images issues de Google Quickdraw (https://quickdraw.withgoogle.com/data). Le jeu de données proposé comprend 5 classes balancées, avec 15000 exemples d'apprentissage et 5000 exemples de validation.
data_analysis_and_cleaning
Le but de ce projet est d'améliorer mes compétence en analyse de données via la statistique describtive mais aussi d'apprendre à détecter les erreurs et à les nettoyer. Le jeux de données est ici de Kaggle.
hand_writtend_digit_classification
The purpose of this projet is to build a deep learning model from scratch in order to classify hand writtend digits. First, I build a Multi-Layers Perceptrons (MLPs) model which allow to get an accuracy of 98%. Second, I try another architecture. I build my own Convnet model from scratch which allow me to get 99% of accuracy.
media-screening
This project aims to news papers to manage Supply Chain Risk. News related to certain events are daily collected then Machine Learning(Clustering), NPL(Translation) and Generative AI(Gemini) are combine to assess collected news relevancy by extracting some information which are then matched with a given dataset containing suppliers informations.
objet_detection
L'objetif de ce projet est de se familiariser avec la détection d'objet en apprentissage profonde mais aussi avec les framework d'apprentissage profond. le même code est proposé à la fois en Pytorch et en Tensorflow/keras
sentiment_analysis
J'ai choisi de réaliser ce projet afin de me familiariser avec le transfert learning des modèles NLP pré-entraîné. J'ai utilisé le modèle BERT développé par google afin de réaliser l'analyse de sentiments sur un jeu de données disponible sur Kaggle. J'ai aussi réalisé le web scraping afin de récolter des commentaires sur des produits sur internet
spam_classification
Ce fut mon prémier projet NLP où j'ai réalisé la détection de spam en utilisant les algorithmes d'embedding pour encorder mes textes. J'ai utilisé Random Forest et Milti-Layres Perceptrons pour la phase de classification. Ce qui a pemit l'obtension des précisions respective de 97% et 98%. J'ai aussi appris à documenter mes codes via sphinx
unet
Implement U-net from scratch for image in order to master all stage of image segmentation algorithm
machine_learning_from_scratch
This project aims to implement some machine learning basic techniques(e.g. MinMaxScaler, StandardScaler, TD-IDF, PCA, Logistic Regression, LDA, KNN, Naive Bayes Classifier) using only pyton, numpy and pandas. This will enable me to have hone my data scientist skills
nlp_clustering
This project aims to clean text data by detecting some duplicates due mistyping. Damerau-Levenshtein distance is use as metric in order to correct these error via a hierarchical clustering
rag_based_chatbot
A RAG based chatbot using local llm, specially Olloma. The chatbot can go in internet via DuckduckGo to search relevant context to answer a given question for which no relevant context has been found in the vectors store. One use LangGraph for assessing the relevancy of a given llm answer.
Spoon-Knife
This repo is for demonstration purposes only.
transfert_learning-images_classification
Ce projet a pour objectif de me familialiser avec le transfert learning des modèle de vision par ordinateur mais aussi le dépliement des modèle de réseaux de neurones sur des clouds computing comme Microsoft Azure ML. J'ai réalisé un score de 91 % pour une classification en 10 catégories au lieux de 1000 pour le modèle de base.