Dec 26, 2025 / Update Dec 30, 2025 1 min read Hero Image paper reading / llm Paper Reading: LLM 1 读一些大型语言模型相关的论文 views | comments 评分准则 平平无奇的论文 正常的论文 广受认可或者让我眼前一亮的论文 奠基性的论文或者我非常喜欢的论文 毋庸置疑的最棒的论文 GPT 1.0# Arxiv ID radford2018improving.pdf 推荐指数: BERT# Arxiv ID 1810.04805 幻觉翻译 1810.04805 推荐指数: GPT 2.0# Arxiv ID language_models_are_unsupervised_multitask_learners.pdf 推荐指数: Megatron-LM# Arxiv ID 1909.08053 幻觉翻译 1909.08053 推荐指数: T5# Arxiv ID 1910.10683 幻觉翻译 1910.10683 推荐指数: ZeRO# Arxiv ID 1910.02054 幻觉翻译 1910.02054 推荐指数: Scaling Law# Arxiv ID 2001.08361 幻觉翻译 2001.08361 推荐指数: GPT 3.0# Arxiv ID 2005.14165 幻觉翻译 2005.14165 推荐指数: Switch Transformers# Arxiv ID 2101.03961 幻觉翻译 2101.03961 推荐指数: Codex# Arxiv ID 2107.03374 幻觉翻译 2107.03374 推荐指数: COT# Arxiv ID 2201.11903 幻觉翻译 2201.11903 推荐指数: InstructGPT# Arxiv ID 2203.02155 幻觉翻译 2203.02155 推荐指数: PaLM# Arxiv ID 2204.02311 幻觉翻译 2204.02311 推荐指数: LLaMA# Arxiv ID 2302.13971 幻觉翻译 2302.13971 推荐指数: GPT 4# Arxiv ID 2303.08774 幻觉翻译 2303.08774 推荐指数: DPO# Arxiv ID 2305.18290 幻觉翻译 2305.18290 推荐指数: ToT# Arxiv ID 2305.10601 幻觉翻译 2305.10601 推荐指数: LLaMA2# Arxiv ID 2307.09288 幻觉翻译 2307.09288 推荐指数: Mistral 7B# Arxiv ID 2310.06825 幻觉翻译 2310.06825 推荐指数: Mamba# Arxiv ID 2312.00752 幻觉翻译 2312.00752 推荐指数: Mamba2# Arxiv ID 2405.21060 幻觉翻译 2405.21060 推荐指数: Qwen2.5# Arxiv ID 2412.15115 幻觉翻译 2412.15115 推荐指数: DeepSeek-V3# Arxiv ID 2412.19437 幻觉翻译 2412.19437 推荐指数: DeepSeek-R1# Arxiv ID 2501.12948 幻觉翻译 2501.12948 推荐指数: Kimi K2# Arxiv ID 2507.20534 幻觉翻译 2507.20534 推荐指数: DFT# Arxiv ID 2508.05629 幻觉翻译 2508.05629 推荐指数: