daiyizheng's repositories
molecular_virtual_screening
分子打分、对接和高通量筛选相关研究
drug-evaluate
分子评估标准
codellama
Inference code for CodeLlama models
DecryptPrompt
总结Prompt&LLM论文,开源数据&模型,AIGC应用
drug-generation-network
药物生成网络模型汇总
drug-optimization-network
药物优化网络模型汇总
Firefly
Firefly(流萤): 中文对话式大语言模型(全量微调+QLoRA),支持微调Aquila2、Baichuan2、CodeLlama、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya、Bloom等大模型
gmx_MMPBSA
gmx_MMPBSA is a new tool based on AMBER's MMPBSA.py aiming to perform end-state free energy calculations with GROMACS files.
jsonschema
An implementation of the JSON Schema specification for Python
llm-action
本项目旨在分享大模型相关技术原理以及实战经验。
mdanalysis
MDAnalysis is a Python library to analyze molecular dynamics simulations.
mdtraj
An open library for the analysis of molecular dynamics trajectories
MedicalGPT
MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)。
MedLLMsPracticalGuide
A curated list of practical guide resources of Medical LLMs (Medical LLMs Tree, Tables, and Papers)
MetaTransformer
Meta-Transformer for Unified Multimodal Learning
mol_gen
分子生成网络
Prompt-Engineering-Guide
🐙 Guides, papers, lecture, notebooks and resources for prompt engineering
pyCADD
A python package for computer-aid drug design.
RLHF-Label-Tool
用于大模型 RLHF 进行人工数据标注排序的工具。A tool for manual response data annotation sorting in RLHF stage.
ScribbleHub
基于SpringBoot3开发的轻量级技术博客小程序,支持 文章发布(支持上传音频内容或视频内容) 专题管理 搜索 以及渲染 以及文章评论功能 无需第三方OSS存储,使用的是服务器存储空间 详细请看yml中的file配置
sentencepiece_chinese_bpe
使用sentencepiece中BPE训练中文词表,并在transformers中进行使用。
TCMChat
Large language model of traditional Chinese medicine
textgen
TextGen: Implementation of Text Generation models, include LLaMA, BLOOM, GPT2, BART, T5, SongNet and so on. 文本生成模型,实现了包括LLaMA,ChatGLM,BLOOM,GPT2,Seq2Seq,BART,T5,UDA等模型的训练和预测,开箱即用。