手机知网 App
24小时专家级知识服务
打 开
计算机软件及计算机应...
手机知网首页
文献检索
期刊
工具书
图书
我的知网
充值中心
基于算子融合和向量化访存的大语言模型部署优化研究
西南交通大学
|
明刚
张艳霞
李旭胜
叶子扬
冯力
邢焕来
朱宗海
开通知网号
随着自然语言处理模型参数量的增加,推理效率和资源利用效率成为大语言模型部署的关键挑战。为了应对这一挑战,文章利用算子融合技术和向量化访存技术优化模型推理速度和资源利用率。实验过程中,选用LLaMA-7B和LLaMA-13B作为基础模型,并通过使用Wi...
领 域:
计算机软件及计算机应用;
自动化技术;
关键词:
算子融合;
向量化访存;
大语言模型;
推理性能;
0
0
下载PDF版
手机阅读本文
下载APP 手机查看本文
首届全国大模型与决策智能大会论文集
2024年
立即查看 >
相似文献
期刊
硕士
博士
会议
报纸
加载中
更多
暂无数据
图书推荐
更多
相关工具书
更多
搜 索