Este repositório contém um dataset com 7121 formulas de medicamentos manipulados.
O objetivo do teste é prever o valor da coluna "correto" com menor erro possível a partir das outras informações do dataset.
dos 7121 pontos de dados, podem usar no máximo os primeiros 5121 dados do dataset para prever os últimos 2000
podem usar o link https://raw.githubusercontent.com/manipulaeHealth/desafio-machine-learning/main/dados_preco.csv para baixar direto no pandas
- Necessário usar Python, ficando livre o uso de qualquer biblioteca;
- Necessário disponibilizar o código de forma que consigamos reproduzir o que foi feito, pode ser em um repositório ou notebook no colab research;
Se possível fazer um relatório usando Power BI para análises no Dataset e compartilhar o pbx depois.
descrição da formula, seguindo o padrão:
qtd unidade_volume | insumos separados por ';'
a unidade de volume vai ser sempre CAP no dataset
os insumos vão ter o padrão:
nome do insumo qtdunidade;
ex: zinco quelado 20mg;
data de criação da formula
quantidade de insumos da formula
preço pré-calculado da formula
preço correto da formula, o objetivo é prever ele