LLaMA-Factory学习记录
数据集的编写LLaMA-Factory 数据集类型总结LLaMA-Factory中数据集总共有4种类型:指令微调(SFT),多轮对话(Chat),偏好数据(DPO),预训练(PT) 根据官方文档,数据集主要分为以下四种,建议按需构建: 类型 格式推荐 核心目标 适用场景 指令微调 (SFT) instruction, output 学会听令行事 基础技能训练、语气模仿。 多轮对话 (Chat) messages (role/content) 上下文连贯性 模拟直播互动、长线聊天、人设维持。 偏好数据 (DPO) chosen, rejected 风格对齐/价值观 纠正模型错误回复,强制选择特定风格。 预训练 (PT) text / content 知识注入 喂入角色百科、长篇背景设定、专业文档。 数据格式实战:ShareGPT (Messages)目前行业标准及 LLaMA-Factory 推荐使用 OpenAI 风格的 messages 格式,不仅支持多轮对话,且兼容性最强 123456789[ { ...
大物
...
无标题
...
计算机网络
...
计算机组成原理
程序的机器级表示调用者保存与被调用者保存 调用者保存:在函数执行前将寄存器内容进行保存,执行完毕后将寄存器内容恢复 被调用者保存:函数执行开始时将寄存器内容保存,函数执行到最后将寄存器内容恢复 磁盘相关计算磁盘对扇区的访问有三个主要的部分:寻道时间、旋转时间、传送时间。 寻道时间:传送臂将读写头定位到目标扇区上移动的时间 旋转时间:驱动器等待目标扇区的第一个位旋转到读写头下。最大延迟是Tmax rotation=1/RPM*60s/1min(旋转速率通常给的是每分钟转多少圈),平均旋转时间为最大旋转时间的一半。 传送时间:一个扇区的传送时间依赖于旋转速度和每条磁道的扇区数目 Cache(高速缓冲存储器)解决CPU和主存间出现的空等问题。 程序访问的局部性原理:(1)时间的局部性 :当前使用的数据,将来可能再次被使用(2)空间的局部性:当前使用的指令和数据,之后相邻的指令和数据可能会被用到。 工作原理主存和缓存按块存储,块的大小相等。 (2)命中和不命中: 缓存有C块,主存共有M块...
日本語勉強
#web_bg{ background: url("../scarlet1.jpg")!important; /*重新定义background会导致原有定位属性失效,所以也需要再声明一次加权的定位属性*/ background-position: center !important; background-size: cover !important; background-repeat: no-repeat...
Unity-UI相关
#web_bg{ background: url("../touka1.jpg")!important; /*重新定义background会导致原有定位属性失效,所以也需要再声明一次加权的定位属性*/ background-position: center !important; background-size: cover !important; background-repeat: no-repeat !important; } 前言仅供本人Unity——UI方面的学习参考 UI即user...
数据持久化
#web_bg{ background: url("../sayumi1.jpg")!important; /*重新定义background会导致原有定位属性失效,所以也需要再声明一次加权的定位属性*/ background-position: center !important; background-size: cover !important; background-repeat: no-repeat !important; } 简介数据持久化...
Unity学习
#web_bg{ background: url("../kanon1.jpg")!important; /*重新定义background会导致原有定位属性失效,所以也需要再声明一次加权的定位属性*/ background-position: center !important; background-size: cover !important; background-repeat: no-repeat...




