我不是工程师
  • 首页
  • 归档
  • 分类
  • 标签
  • 书单
  • 写给自己
  • 关于

共计 16 篇文章


2024

06-22
为什么文本相似度使用余弦相似度?
06-12
Why Decoder-Only Instead of Encoder-Only?
05-07
解读KANs:网络架构中对激活函数的学习
04-20
源码分析:LlaMA3的工程代码实现
04-10
源码分析:MoE专家架构
03-31
LLM推理与训练显存的计算方法
03-09
MiniBPE:探究Github上最简单的BPE实现代码
02-13
从零开始训练自己的GPT
02-11
代码实战:Word2Vec的Pytorch实现
01-14
李开复争议之作:使用vllm上手YI-34B大模型
12

搜索

总访问量 次 总访客数 人
载入天数... 载入时分秒...