乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

国家技术转移东部中心

乐清市人民政府

人工智能

向量量化大语言模型的算子融合机制分配方法与系统

本发明提供一种向量量化大语言模型的算子融合机制分配方法与系统，所述方法包括以下步骤：获取布局数据，其中，布局数据包括解量化数据布局以及计算内核所需布局；基于布局数据计算得到数据混洗次数，并基于数据混洗次数与预设阈值进行比较，以动态响应决策机制，当数据混洗次数小于预设阈值，则采用第一决策机制，第一决策机制至少包括寄存器级别算子融合机制；当数据混洗次数大于或者等于预设阈值，则采用第二决策机制，第二决策机制至少包括共享内存级别算子融合机制。本发明的向量量化大语言模型的算子融合机制分配方法与系统，解决了数据在共享内存和寄存器之间频繁传输导致的带宽瓶颈和延迟问题，从而实现了更高效的解量化与计算融合。
上海交通大学 | 上海期智研究院
冷静文 | 黄佳薇 | 刘子汉 | 过敏意

More Posts

新闻资讯|OUR创新生态联盟体项目路演活动圆满举办 ——聚焦智能电气与新能源技术转化

2025年11月29日

“规则的天空”：中国低空空域管理与安全体系演进趋势研究

2025年11月10日

新闻资讯 | 乐清市科学技术局-国家技术转移东部中心海外项目路演线上专场-中白科技创新对接会

2025年9月24日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办

2023年11月24日

Send Us A Message