DeepSeek-V3 Technical Report

DeepSeek-AI, Kexin Huang, Jingchang Chen, Bingxuan Wang, Chong Ruan, Hanwei Xu, Bei Feng, Kang Guan, Aixin Liu, Damai Dai(Microsoft Research (India)), Han Bao, Haocheng Wang, Dejian Yang, Dongjie Ji, Chen Jin(Duke University), Fuli Luo, Daya Guo(Sun Yat-sen University), Junxiao Song, Guangbo Hao(University College Cork), Honghui Ding, Jiali Cai, Junjie Qiu, Chenggang Zhao, Jianzhong Guo, Chengqi Deng, Deli Chen, Guan-Ting Chen, Chengda Lu(China University of Geosciences), Chenyu Zhang, Haowei Zhang, Hui Li(Chinese Academy of Sciences), Junlong Li, Bing Xue(Zhejiang Ocean University), Kai Dong, Kai Hu, Huazuo Gao, Hui Qü(Qilu Hospital of Shandong University), Bowen Wu, Jiashi Li, H. Zhang, Fangyun Lin, Huajian Xin, Guowei Li(Institute of Computing Technology), Jian Liang, Ni Jiang, Erhang Li, J. Wang, Jingyang Yuan(Hunan Agricultural University), Kaige Gao

arXiv (Cornell University)

December 27, 2024

10.48550/arxiv.2412.19437

Cited by 239

Related Papers

CodeBERT: A Pre-Trained Model for Programming and Natural Languages

|Unknown|2020|2.5k

Genome-wide programmable transcriptional memory by CRISPR-based epigenome editing

|Cell|2021|748

DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning

|Nature|2025|610

UniXcoder: Unified Cross-Modal Pre-training for Code Representation

|Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)|2022|554

Can Open Large Language Models Catch Vulnerabilities?

|arXiv (Cornell University)|2025|501