我不是工程师
  • 首页
  • 归档
  • 分类
  • 标签
  • 书单
  • 写给自己
  • 关于
LlaMA的工程代码实现

LlaMA的工程代码实现

LlaMA的工程代码实现,包括Tokenizer, RMSNorm, RoPE, Transformer, FFN, generate等。
2024-01-01
LLM
#工程实践 #LLM #NLP #LlaMA
解读LlaMA Paper: 开放且高效的基础语言模型集

解读LlaMA Paper: 开放且高效的基础语言模型集

精读Meta团队发布于2022年的论文:原文翻译及架构分析。
2024-01-01
LLM
#LLM #NLP #LlaMA
博弈论:纳什均衡

博弈论:纳什均衡

博弈论中的纳什均衡及推导。
2023-12-31
博弈论
#博弈论
博弈论:利己主义者的游戏

博弈论:利己主义者的游戏

博弈论中的利己主义,囚徒困境与零和博弈。
2023-12-31
博弈论
#博弈论

写在2023的最后一天

总结一下2023年。
2023-12-31
随笔
#随笔
博弈论:基本概念

博弈论:基本概念

博弈论的一些基础概念,包括定义,分类以及收益矩阵等。
2023-12-30
博弈论
#博弈论
Python开发:Argparse/配置环境变量

Python开发:Argparse/配置环境变量

使用Argparse库能够解析命令行参数,运行用户在命令行直接为程序进行赋值。
2023-12-30
Python
#工程实践 #Python
详解Mixtral 8*7B: 高质量的专家组合模型

详解Mixtral 8*7B: 高质量的专家组合模型

Mistral AI团队带来的开源新模型,以更小的参数量超过了LLama2 70B。
2023-12-30
LLM
#LLM #NLP
Python开发:换源/更新Python包/虚拟环境

Python开发:换源/更新Python包/虚拟环境

上手Python开发的一些必要流程。
2023-12-29
Python
#Python
项目协同开发-Git基础操作

项目协同开发-Git基础操作

项目版本控制/协同开发必不可少的Git命令:git branch/git remote/git switch/etc。
2023-12-29
Git
#工程实践 #Git
1…78910

搜索

总访问量 次 总访客数 人
载入天数... 载入时分秒...