๐
EfficientLLM: Speed always wins repository
์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค! ์ ํฌ๋Transformer
์ํคํ ์ฒ์ ๊ทผ๋ณธ์ ์ธ ๋นํจ์จ์ฑ์ ํ๊ตฌํ๊ณ ,Sparse Attention
๊ณผSpeculative Decoding
๊ฐ์ ์ต์ ์ต์ ํ ๊ธฐ์ ๋ค์ ๊น์ด ์๊ฒ ๋ค๋ฃน๋๋ค. ์ฐ๋ฆฌ์ ๋ชฉํ๋Large Language Models
์ ์ฑ๋ฅ ์ฅ๋ฒฝ์ ๋ํํ๋ ๊ฒ์ ๋๋ค.LLM
์ ๋ ๋น ๋ฅด๊ณ , ๋ ํจ์จ์ ์ด๋ฉฐ, ๋ ์ฝ๊ฒ ์ ๊ทผํ ์ ์๋๋ก ๋ง๋๋ ์ฌ์ ์ ํจ๊ปํด์ฃผ์ธ์!
"์ํคํ ์ฒ ์์ค์ ๊น์ด ์๋ ์ดํด๋ฅผ ํตํด LLM ์ถ๋ก ์ ํ์ค์ ์ธ ์ฅ๋ฒฝ์ ๋์ด์๋ค"
Transformer์
๋ณธ ํ๋ก์ ํธ๋ LLM ์ถ๋ก ํจ์จ์ ๋์ด๊ธฐ ์ํ ๋ ๊ฐ์ง ํต์ฌ ์ถ, Sparse Attention๊ณผ Speculative Decoding์ ์ค์ฌ์ผ๋ก ์ต์ ์ฐ๊ตฌ๋ค์ ํ๊ตฌํ์ฌ ๋ค์๊ณผ ๊ฐ์ ์ญ๋์ ๊ฐ์ถ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
- ํต์ฌ ์๋ฆฌ ์ดํด: ๊ฐ ์ต์ ํ ๊ธฐ์ ์ ์๋ ๋ฐฉ์์ ์ํคํ ์ฒ ์์ค์์ ๊น์ด ์๊ฒ ์ดํดํฉ๋๋ค.
- ํต์ฐฐ๋ ฅ ํ๋ณด: ์ด๋ค ์ํฉ์์ ์ด๋ค ๊ธฐ์ ์ด ํจ๊ณผ์ ์ธ์ง์ ๋ํ ํต์ฐฐ๋ ฅ์ ๊ธฐ๋ฆ ๋๋ค.
- ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ: ๋น์ฉ๊ณผ ์๋์ ์ ์ฝ์ ํด๊ฒฐํ ์ ์๋ ์ค์ง์ ์ธ ์ญ๋์ ๊ฐ์ถฅ๋๋ค.
- ์ง์ ๊ณต์ : ๋ชจ๋ ํ์ต ๊ฒฐ๊ณผ๋ฌผ์ ๊ณต๊ฐํ์ฌ ๊ตญ๋ด LLM ์ํ๊ณ์ ๊ธฐ์ฌํฉ๋๋ค.
์ญํ | ์ด๋ฆ | |
---|---|---|
Project Manager | ์ ๊ฒฝํธ | |
Member | ๊ธธ์ฌ์ | |
Member | ๊น์น์ฐ | |
Member | ๊นํ๊ท | |
Member | ๋ฐ์ฌ์ฑ | |
Member | ์ด์น์ |
- ์๊ฐ: ๋งค์ฃผ ํ์์ผ 20:00-22:00
- ์ฅ์: Room-AT
๋ ์ง | ๋ด์ฉ | ๋ฐํ์ | ์์ |
---|---|---|---|
2025/9/9 | OT | ์ ๊ฒฝํธ | |
2025/9/16 | Speed Always Wins: A Survey on Efficient Architectures for Large Language Models Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding |
์ ๊ฒฝํธ ๊ธธ์ฌ์ |
|
2025/9/23 | vLLM | ๋ฐ์ฌ์ฑ ์ด์น์ |
|
2025/9/30 | ๊น์น์ฐ ๊นํ๊ท |
||
2025/10/7 | ์ ๊ฒฝํธ ๊ธธ์ฌ์ |
||
2025/10/14 | ๋ฐ์ฌ์ฑ ์ด์น์ |
||
2025/10/21 | ๊น์น์ฐ ๊นํ๊ท |
||
2025/10/30 | ์ ๊ฒฝํธ ๊ธธ์ฌ์ |
||
2025/11/4 | ๋ฐ์ฌ์ฑ ์ด์น์ |
||
2025/11/11 | ๊น์น์ฐ ๊นํ๊ท |
||
2025/11/18 | ์ ๊ฒฝํธ ๊ธธ์ฌ์ |
||
2025/11/25 | ๋ฐ์ฌ์ฑ ์ด์น์ |
||
2025/12/2 | ๊น์น์ฐ ๊นํ๊ท |
||
2025/12/9 | ์ ๊ฒฝํธ ๊ธธ์ฌ์ |
||
2025/12/16 | ๋ฐ์ฌ์ฑ ์ด์น์ |
||
2025/12/23 | ๊น์น์ฐ ๊นํ๊ท |
- Speed Always Wins: A Survey on Efficient Architectures for Large Language Models
- Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding
- ๋น๋๋ก ์ฐธ์ฌ โ ํ๋ก์ ํธ ๊ธฐํยท์ด์ ์ฃผ๋
- ๋ฌ๋๋ก ์ฐธ์ฌ โ ์ฐ๊ตฌยท๊ฐ๋ฐยทํ ์คํธ ๋ฑ ์คํ
- ์ฒญ๊ฐ ์ฐธ์ฌ โ ๊ณต๊ฐ ์ธ์ ์ฐธ์ฌ ๊ฐ๋ฅ
โ๏ธ์ฐธ์ฌ ๋งํฌ: ๊ฐ์ง์ฐ๊ตฌ์ ๋์ค์ฝ๋ โ๏ธ์ปค๋ฎค๋์ผ์ด์ ์ฑ๋: ๋์ค์ฝ๋ #{{์ฑ๋๋ช }}
๋๊ตฌ๋ ์ฒญ๊ฐ์ ํตํด ๋ชจ์์ ์ฐธ์ฌํ์ค ์ ์์ต๋๋ค.
- ํน๋ณํ ์ ์ฒญ ์์ด ์ ๊ธฐ ๋ชจ์ ์๊ฐ์ ๋ง์ถ์ด ๋์ค์ฝ๋ #Room-GH ์ฑ๋๋ก ์ ์ฅ
- Magical Week ์ค ํ์ฌ์ ์ฐธ๊ฐ
- Pseudo Lab ํ์ฌ์์ ๋ง๋๊ธฐ
์ด ํ๋ก์ ํธ๋ ๊ฐ์ง์ฐ๊ตฌ์ Open Academy๋ก ์งํ๋ฉ๋๋ค. ์ฌ๋ฌ๋ถ์ ์ฐธ์ฌ์ ๊ธฐ์ฌ๊ฐ โ์ฐ์ฐํ ํ๋ช (Serendipity Revolution)โ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. ๋ชจ๋์๊ฒ ๊น์ ๊ฐ์ฌ๋ฅผ ์ ํฉ๋๋ค. OOO is developed as part of Pseudo-Lab's Open Research Initiative. Special thanks to our contributors and the open source community for their valuable insights and contributions.
Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.
This project is licensed under the MIT License.