andstor / bibliography

Bibliography database

https://github.com/andstor/bibliography/wiki/Home.md

Supervised Learning

Classification

Regression

Semi supervised Learning

Unsupervised Learning

Clustering

Self-supervised Learning

Text Generation

Codex Evaluating Large Language Models Trained on Code, Chen Mark. et al. (2021).

Reinforcement Learning 🤖

(survey) Reinforcement learning: A survey, Kaelbling L. et al. (1996).

Policy-based 💪

Policy gradient

PPO Proximal Policy Optimization Algorithms, Schulman J. et al. (2017). 🎞️
InstructGPT Training language models to follow instructions with human feedback, Ouyang L. et al. (2022). 🃏

Decoding Strategies

Greedy Search

Beam Search

Prompt Engineering 💬

(survey) Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing, Liu P. et al. (2021). 🌐

Discrete Prompt

Continuous Prompt

Hybrid Prompt

Evaluation

Who Evaluates the Evaluators? On Automatic Metrics for Assessing AI-based Offensive Code Generators

About

Bibliography database