压缩算法为大语言模型“瘦身”
时间:2024-11-23 10:39:37来源:科技日报
据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。

标签:

最新
  • 压缩算法为大语言模型“瘦身”

    据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学

  • 京津冀地区游客沈阳游搜索热度环比上涨46%!

    自10月下旬的周末向北 沈阳最美2024沈阳赴北京城市主题推介会成功

  • 房间隔断简单又实惠方法有哪些?屋子大了用什么材料隔断?

    房间隔断简单又实惠方法有哪些?1、‌玻璃隔断‌:玻璃隔断

  • 海南环岛旅游公路(万宁石梅湾互通至陵水香水湾互通段)国际方案竞赛正式启动

    由海南省自然资源和规划厅主办,上海市政工程设计研究总院(集团)有

  • “我来北京上大学”2024年残疾人大学生分享会举行

    中新网北京11月9日电 (记者 李京泽)我来北京上大学2024年残疾人大

  • 海外网友热赞!摄影师镜头里的海南,让人一眼心醉

    近日,由中国互联网发展基金会、中国正能量网络传播专项基金支持,

  • 泰国留学生:非常喜欢安徽的文化与美食

    11月1日晚,为期三天的2024中泰文旅嘉年华活动在安徽黄山举行。60多

  • 专家学者齐聚南昌 共话江西航空产业发展新机遇

    中新网南昌11月3日电(卢梦梦)2日,2024中国航空产业大会在江西南昌

  • 2024年医保目录现场谈判竞价正式开始 结果拟于11月公布

    今天上午8点半,2024年医保目录现场谈判竞价在北京正式开始。根据此

  • 9月家用电器和音像器材类零售额增长20.5% 家电业抢抓机遇发展势头好

    9月家用电器和音像器材类零售额增长20 5%,智能家电增速超30%家电业

  • 中国工信部:加快培育低空物流等低空消费新业态

    中新社北京10月23日电 (记者 刘育英)中国工业和信息化部新闻发言

  • 如何安装机顶盒?机顶盒是干什么用的?|速看

    如何安装机顶盒?**一、准备阶段**首先,确保你已经购买了适配的机顶

  • 秦岭大熊猫乐享秋日时光_当前独家

    10月12日,位于陕西省汉中市佛坪县的秦岭大熊猫救护繁育研究基地内

  • 还漓江“美貌” 广西实施漓江风景区杆塔线缆迁建改造工程 当前滚动

    广西壮族自治区通信管理局30日介绍,广西实施漓江风景区杆塔线缆迁

  • 环球微资讯!上交所:自10月8日起延长接受指定交易申报指令时间

    中新网10月6日电 据上交所网站消息,上交所10月6日发布《关于延长

  • 全球时讯:国庆假期运输以来 国家铁路累计货物发送量完成6882.3万吨

    从9月29日国庆假期运输启动至10月4日,国家铁路:日均装车18 87万车

  • 旅游
    • 打破围墙,宝山区“一墙美术馆”让艺术近在咫尺间

    • 茶百道赴港IPO,刘永好投了,背后还有这支神秘基金

    • 晨会聚焦

    • 安徽巡抚陈用敷奏二麦雨水情形诗以志慰(关于安徽巡抚陈用敷奏二麦雨水情形诗以志慰简述)