Chainbase开源首个加密领域大模型Theia-Llama-3.1-8B,性能超越主流模型
BlockBeats 消息,10 月 11 日,近日全链数据网络 Chainbase 宣布在 HuggingFace 开源其专为加密领域打造的大语言模型 Theia-Llama-3.1-8B。该模型在困惑度(Perplexity)和 BERT 评分上均超越了市场主流模型,对 crypto 世界的理解能力超过大多主流开源大模型。Chainbase 团队独创性地构建了首个专业 Web3 数据集,收录了 CoinMarketCap 前 2000 项目的各类资料。数据集经过手动和算法过滤,确保训练数据的准确性、多样性和专业性。基于此数据集,团队采用 LoRA 技术高效微调模型,并利用 DeepSpeed 等工具加速训练过程。此外,模型量化为 Q8 GGUF 格式,大幅降低了内存占用,提升了推理速度。据悉,Theia-Llama-3.1-8B 是 Chainbase 在加密领域大模型的初步尝试且该模型已成功应用于 Chainbase DEMO 交互应用 TheiaChat,目前日活用户超过 30 万。
本文由币特网发布,不代表币特网立场,转载联系作者并注明出处:https://www.qhbxg.cn/live/3696g3sh.html