fly51fly / aicoco

“爱可可-爱生活”微博内容精选

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

爱可可微博热门分享(4.25)

fly51fly opened this issue · comments

No 1. #免费##抽奖# 携手@博文视点Broadview 送出3本《多模态大模型:新一代人工智能技术范式 (全彩)》
No 2. 用Pytorch从头实现Transformer
No 3. tiny-gpu:开源的 Verilog 语言编写的 GPU 设计项目,旨在帮助人们从底层上理解 GPU 是如何工作的
No 4. 'Llama3-Chinese:以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 ......
No 5. phidata:为 LLM 添加长期记忆,旨在解决 LLM 有限的上下文和无法采取行动的问题
No 6. [CL] Achieving >97% on GSM8K: Deeply Understanding the Problems ......
No 7. 游戏是学习编程的最佳方式——从CSS、Python、JavaScript到区块链。十个最佳在线通过游戏学编程网站推荐: ......
No 8. [CL]《Transformers Can Represent nn-gram Language Models》
No 9. Unichat-llama3-Chinese:联通AI创新中心发布业界llama3中文指令微调模型
No 10. 信息图:商用LLM参数规模一览 src: ​
No 11. Infinite-Realities 展示了实时 3D/4D Gaussian splatting 的最新工作,可以捕捉从复杂的角色互动到动态的快速战斗场景,甚至是家人和朋友的记忆,其重点是高质量和高保真度。 ......
No 12. Snowflake Arctic:面向企业AI的大语言模型
No 13. 早![太阳] ​
No 14. llama2.cpp:C++ 版本的 Llama 2 推理库,支持 CPU 计算,并且计划支持 CUDA 和 AVX512
No 15. 用AI编辑人类基因
No 16. [CL]《Multi-Head Mixture-of-Experts》
No 17. 用了半个亿GPT Token得出的经验
No 18. 用AutoTrain Advanced在MacBook Pro上微调phi-3模型
No 19. A Trivial Jailbreak Against Llama 3:用于绕过 Llama 3 模型安全措施的程序,可以通过在助手角色中插入有害前缀来绕过 Llama 3 的安全措施,从而生成有害的文本,还可以通过调用其他模型生成有害前缀,然后将其传递给 Llama 3
No 20. LLMBox:用于实现大语言模型的综合库,提供统一的训练流程和全面的模型评估
No 21. Cohere Toolkit:一组预构建的组件,使用户能够快速构建和部署 RAG(Retrieval Augmented Generation)应用
No 22. Meta做了OpenAI本该做的
No 23. 通过构造等价的Transformer语言模型,证明了Transformer可以精确表示传统n-gram语言模型,建立了它们之间的确切数学关系,是理解Transformer概率表示能力的第一步。//[CL]《Transformers Can Represent nn-gram Language Models》
No 24. [CV] FlowMap: High-Quality Camera Poses, Intrinsics, and Depth ......
No 25. [LG]《NExT: Teaching Large Language Models to Reason about Code Execution》
No 26. seemore:用 PyTorch 从头开始实现的视觉语言模型
No 27. 使用PyTorch FSDP和Q-Lora高效微调Llama 3
No 28. [CL] Phi-3 Technical Report: A Highly Capable Language Model ......
No 29. 基于扩散模型的视频生成
No 30. 文档图像处理的论文和数据集列表,涵盖了外观增强、阴影消除、矫正、去模糊和二值化等方面
No 31. Diarizers:使用 Hugging Face 生态系统微调 Pyannote 说话人辨识模型的库
No 32. LangChain Rust:用 Rust 语言实现的 LangChain,提供了 LLM、Embeddings、VectorStores、Chain、Agents、Tools 等功能,并支持多种 LLM 和 VectorStores
No 33. WebLlama:基于 Llama3 的能浏览网页、可以遵循指令并与用户交互的Agent
No 34. 开源机器学习编译器的“理想与现实” src:http://t.cn/A6TEd5ne
No 35. [CL]《OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework》
No 36. 今日推介(第1386期):基于开源训练和推理框架的高效语言模型族、从对抗压缩角度重新思考LLM记忆、教大型语言模型推理代码执行、多头Mixture-of-Experts、Transformer可以表示n-gram语言模型 ......
No 37. 几篇论文实现代码
No 38. [CL]《Better Synthetic Data by Retrieving and Transforming Existing Datasets》
No 39. [LG]《Rethinking LLM Memorization through the Lens of Adversarial Compression》
No 40. [CL] A Survey on Self-Evolution of Large Language Models 网页链接 ......
No 41. llama3-Chinese-chat:首个llama3 中文版) ,供学习交流演示
No 42. MuKoe:开源的 MuZero 实现,利用 Ray 作为分布式调度器,在 GKE 上运行
No 43. [CL]《A Multimodal Automated Interpretability Agent》
No 44. [CL] AdvPrompter: Fast Adaptive Adversarial Prompting for ......
No 45. Terrarium - A Simple Python Sandbox:简单易用的 Python 沙箱,用于执行不受信任的用户或 LLM 生成的 Python 代码
No 46. 'QuickRecorder - A lightweight screen recorder based on ScreenCapture ......
No 47. 新书:《AI辅助编程》,关于如何利用人工智能开发工具进行代码创建的实用指南,适合初学者和经验丰富的开发者
No 48. OpenELM通过采用层级缩放策略、在公开数据集预训练后微调,实现了transformer语言模型效果的改进,并发布了完整的开源框架,以推动该领域的公开研究。//[CL]《OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework》
No 49. [CL] SnapKV: LLM Knows What You are Looking for Before Generation ......
No 50. LLM在多模态生成领域应用相关论文与资源列表