March 26, 2023 #gpt #language-model #compression #NNCP 为什么说 GPT 是无损压缩 上周一从 Tim 处听到一个“暴论”:大语言模型本质上是无损压缩。可惜聊天的时间太短了,Tim 说不完这个理论。经过一段时间的网上冲浪,我也从多个地方 Read more
March 20, 2023 #gpt #language-model #torch 握着你的手训一个类GPT语言模型 (二) 书接上回,我们搞了个最简单的胡说八道机,距离GPT其实只差更科学的模型结构了。本文中公式较多,嚼不动的同学建议参看一些图文并茂的科普文。 上下 Read more
March 12, 2023 #gpt #language-model #torch 握着你的手训一个类GPT语言模型 (一) 这段时间 ChatGPT 大有 AI 奇点将至的势头,它展现的各种能力也的确很惊人,让人忍不住想要复刻一个。不过我从来没搞过 NLP 相关领域,机缘巧合在 youtube 上看见 Andrew Karpathy 的视 Read more