不如釜底抽薪」的大模型 Yi-34B 引发争议,因研究者发现其基本采用 LLaMA 架构,但只是对两个张量进行了重命名。
2. 有关该模型的性能和成就,包括上下文窗口大小超过200k、一次处理40万汉字、在 Hugging Face 全球开源模型排行榜中获得双料冠军等。
3. 在社区中有人指出,Yi-34B 实际上是对 LLaMA 代码的一次重构,但未作实质性改变,引起对虚假宣传、许可证违规等问题的疑虑。公司回应表示基于 GPT 结构,并在模型训练中遇到的一些需求导致了代码重命名。
站长之家(11月15日 消息:最近,「零一万物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架构但改变张量名引发争议。这一争议中,研究者指出其代码实际上是对 LLaMA 代码的一次重构,只是未作实质性改变。社区担心这可能违反了许可证规定,且未经过框架支持的外部代码附加可能存在安全风险。
Yi-34B 的成就在开源大模型领域引起了广泛关注,其上下文窗口大小超过200k,能处理40万汉字,成为全球开源模型双料冠军。然而,争议的核心在于其是否真正符合 LLaMA 的许可协议,以及对模型代码的更改是否属于虚假宣传。
在社区的讨论中,有人提到模型的性能参数和配置存在疑虑,包括模型被标榜为32K 模型实际上配置为4K 模型的问题。此外,对于模型的微调数据和基准测试的信息也没有充分提供,引起了社区的疑虑。
「零一万物」公司回应称,他们的模型结构基于 GPT 成熟结构,但在训练实验中由于需求对代码进行了更名。他们强调模型的结构只是其中一部分,投入了大量研发工作在数据工程、训练方法、评估方法等方面,这是他们在大模型预训练阶段的核心技术护城河。最后,他们表示尊重社区的反馈,将代码进行更新以更好地融入 Transformer 生态。
综合来看,争议集中在「零一万物」公司的 Yi-34B 模型是否违反了开源协议,以及其在性能参数和代码修改上的透明度。这一事件提醒开源社区对于模型的合规性和透明度的重要性,同时也反映了在开源领域中公司的技术选择可能引发广泛关注和争议的现实。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
11月24日,零一万物基正式发布并开源微调模型Yi-34B-Chat,可申请免费商用。零一万物还为开发者提供了4bit/8bit量化版模型,Yi-34B-Chat4bit量化版模型可以直接在消费级显卡上使用。Yi系列模型已在ModelScope社区开源,开发者可以在社区中下载、推理和训练这些模型。
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布——在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2Chat70B、Claude2、ChatGPT!不仅如此,在加州大学伯克利分校主导的LMSYSORG排行榜中,Yi-34B-Chat也以1102的Elo评分,晋升最新开源SOTA开源模型之列,性能表现追平GPT-3.5。在五花八门的大模型评测中,伯克利LMSYSORG排行榜采用了一个最为接近用户体感的“聊天机器人竞技场”特殊测评模式,让众多大语言模型在评测平台随机进行一对一battle,通过众筹真实用户来进行线上实时盲测和匿名投票,11月份经25000的线个大模型的总得分。”现在,Eric已经成为Yi-34B的忠实拥趸,会使用Yi-34b-200k数据集训练其他的模型产品,并感叹丝滑般的训练体验。
华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答,能够实现对世界的观察”,对图片进行深入问答交流和精确描述。值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。
今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”,据不完全统计,今年1-7月国内共发布了64个大模型,截至目前叫得出名字的国产大模型已接近200家。这么多大模型,哪些是真能打的?在每天冒出来的各类“榜单”上出现了“家家第一”的情况,甚至已不止一款国产大模型“碾压”了GPT-4,且很多“世界顶级”大模型是出自刚成立的团队之手。有没有B端客�
李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大学伯克利分校主导的LMSYSORG排行榜中,以1102的Elo评分追平了GPT-3.5。这一系列的成绩和问题共同勾勒出Yi-34B-Chat模型的成功轨迹,尽管受到一些质疑,但其在技术创新和用户体验方面的表现仍然备受瞩目。
汉字序顺并不定一影阅响读。日本东京大学的一项实验发现,这个“定理”居然也适合GPT-4。他还把这段内容放进了OpenA官方的tokenizer工具,发现GPT-4看到的token其实是这样的:这里面除了“UNDER”、“SEA”和“OF”之外,几乎剩下的所有token都看起来“毫无逻辑”,这更加使人费解了。
在理想汽车智能软件发布会上,理想带来了MindGPT,这是理想全自研的多模态认知大模型,目前还处于内测版本。MindGPT是行业唯一不需要任何指令词就可以使用的大模型,也是行业唯一真正围绕车载场景打造的大模型。理想汽车全国405家零售中心的展车及试驾车已全部全面升级至OTA5.0内测版,迎接用户到店体验。
gptcrawler是一款强大的工具,能够将网站内容全面地爬取下来,并将其转换成结构化知识,为GPTs的学习提供了有力支持。这个工具的应用场景广泛,比如,如果你想打造一个数字人分身,可以先将自己在社交媒体或个人博客上的内容抓取下来,然后提交给ChatGPT作为储备知识。Crawlee还提供了大量的配置项,用户可以根据自己的需求进行灵活设置,从更好地适应不同的爬取任务。
给你一首曲子的音频和一件乐器的3D模型,然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色,看它是钢琴曲还是小提琴曲又或是来自吉他;同时用视觉识别那是件什么乐器。用等价的线性投影模块替换其中一个Q-Former后,图像-3D的性能会下降一半以上,音频-视频的性能会下降超过10个点。
“取消今晚所有计划!”,许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由MistralAI发布。最新的梗图:磁力链接就是新的arXiv。
Rayscape是一款先进的放射学人工智能解决方案,通过使用前沿的深度学习技术,提高X射线和CT的准确性和效率。我们为肺癌筛查、诊断成像和肿瘤学提供AI辅助诊断。
HO HO Hello是一个定制圣诞老人视频信息的在线平台。用户可以在该网站上定制一段圣诞老人针对孩子的视频信息,视频内容会包含孩子的名字以及父母提供的其他个人信息。该服务定价合理,一段孩子个性化视频信息仅需$14.95美元,最快24小时内发送。它是给孩子制作难忘圣诞礼物以及培养节日气氛的好选择。
LowerEBill是一个免费的电力计划比较和推荐平台。它利用专利AI技术,根据用户的用电历史数据,从3000多个计划中找到最省钱的个性化电价计划。主要功能包括:地址搜索立即匹配历史用电数据;AI算法计算最省钱计划推荐;每日更新的电价计划库;方便快捷的电力计划比较等。可大幅降低电费开支,提高生活质量。
VOODOO 3D是一种高保线D感知一次性头部重现技术。我们的方法将驱动者的表情转移到源头,并为全息显示产生视图一致的渲染。该方法基于完全体积神经解缠框架,用于源外观和驱动表情的3D感知一次性头部重现方法。我们的方法实时性强,产生的输出高保真且视图一致,适用于基于全息显示的3D远程会议系统。我们在各种数据集上展示了最先进的性能,并展示了对高度具有挑战性和多样化主题的高质量3D感知头部重现,包括非正面头部姿势和源头和驱动方的复杂表情。
IXORD是一个人工智能驱动的家庭规划应用,通过智能列表、协作日程和无缝组织,帮助用户简化家庭计划。主要功能包括:个性化备忘录、解释复杂任务的AI助手、平衡工作和生活等。定位为个人ORGANIZER和助手。
Shopilot是一款智能购物助手,能够帮助用户在购物过程中快速找到最低的在线价格。用户只需扫描商品条形码,即可立即发现最低的在线价格。此外,用户还可以与AI进行对话,获取详细的产品信息和建议。Shopilot还支持自动创建购物清单,根据用户想要制作的食谱自动生成购物清单。用户还可以通过拍照的方式整理和管理购物小票,包括购买的商品信息。此外,Shopilot还能帮助用户节省日常外卖的开支,让用户利用家中现有食材烹饪更实惠、更美味的餐点。
Twinit是一个AI角色交流平台,提供各种虚拟角色供用户交流。用户可以与不同角色互动,包括文字聊天和语音交流。该平台的角色种类繁多,包括视觉角色和语音角色,每个角色都有自己的特点和个性。Twinit定价灵活,用户可以根据需求选择订阅不同角色或功能。该产品定位于为用户提供虚拟角色交流的全新体验。
AiBucket是一个集成了各种AI工具的平台,帮助用户快速找到最适合的工具,加速工作效率。平台提供了各种AI工具,涵盖图像处理、文档处理、SEO优化、产品设计等多个领域。这些工具都经过筛选,确保质量和可靠性。用户可以免费使用这些工具,提升工作效率。
NullFace是一款利用人工智能技术生成匿名面部视频的工具。用户只需分享自己的想法,NullFace即可自动为其生成面部模糊的视频,使用户能够在社交媒体上分享内容而不必曝光个人面部。该工具可自动管理社交媒体渠道,生成观看和收入,无需持续创作内容或成为渠道的焦点。NullFace让用户能够轻松地在线赚取收入,解锁社交媒体的力量。
Songbird 是一个集听新闻、读资讯和获取信息于一体的产品。它提供快速、简洁的新闻浏览功能,帮助用户了解最新的新闻和资讯。通过 Songbird,用户可以方便地收听各种新闻、阅读文章,并获得客观、中立的信息。Songbird 专注于为忙碌的用户提供中立的新闻报道,帮助他们更好地了解世界。
Smart Content是一种智能内容生成工具,使用AI技术快速生成电子邮件文本。它可以帮助您节省时间和精力,为您的电子邮件营销活动提供新鲜的内容。Smart Content可以根据您的要求生成多个版本的电子邮件文本,并提供编辑和优化功能。它还提供了预定义的模板和建议,以帮助您在几分钟内创建出色的电子邮件。
Neexa是一个AI驱动的销售助手,旨在24/7全天候地代表您处理客户反对、谈判和成交。它确保您所有的潜在客户都得到及时、策略性的回复。
AI Snap是一款革命性的AI绘画应用,能够将您的照片和视频转化为迷人的艺术作品。它提供多种艺术风格供您选择,让您探索无限的创作可能性。AI Snap能够瞬间将日常瞬间转化为艺术奇迹,同时还支持个性化调整参数,实现您风格与AI创意的完美融合。不仅能够转化照片,还能将视频转化为迷人的艺术形式。AI Snap重视用户反馈,欢迎您与我们分享您的想法、建议和艺术发现。
Agenda Hero是一个Chrome插件,可以智能分析文本,抓取时间、地点等信息生成日历事件,支持一键发送到Google日历。它可以极大提高日程规划效率。
Try On Now是一款基于AI技术的虚拟试衣产品,通过使用数十亿张照片训练的AI模型,能够快速准确地识别用户的体态并提供愉悦的虚拟试衣体验。它可以让用户在线上尝试任何服装,从知名品牌到最新潮流,为线上购物带来智能便利和真实体验。对于商家来说,Try On Now还提供了多商店集成、个性化购买体验等功能,可帮助提升转化率和降低成本。
Digest AI是一款基于AI技术的视频转文本、博客生成工具。用户只需输入YouTube视频链接,Digest AI就会分析视频内容并生成结构化的文章或摘要,帮助用户节省时间和精力。Digest AI的优势在于其高效、准确、易用,适用于内容创作者、教育者和学习者。
imagepipeline提供REST API服务,用户可以通过API调用Stable Diffusion等模型来生成AI图像,无需维护GPU服务器。主要功能包括Stable Diffusion图像生成、自定义模型上传、Lora和Controlnets管道组合等。优势是易用、性价比高,无需自建服务端。定价分月付费和企业定制两种。定位是AI创业公司和个人开发者。
Mental Pro是一个通过思想训练帮助男性提高头脑韧性和自律性的在线分钟的思想训练技巧,冷水浴协议来帮助减压和提高清醒度,以及针对性的AI辅导服务。产品定位中高端人群。
Creatify 是一款基于人工智能的应用程序,可以从简单的产品链接或文本描述中生成高质量的营销视频。无需任何视频制作经验,只需点击几下即可定制无限的变体。
利用人工智能的力量,使用 LinkBoss 来改善你的 WordPress 网站的内部链接策略。无需费力,轻松建立强大的主题群,并利用智能上下文链接功能提高网站的排名。无论是批量内部链接、为上下文生成新内容,还是管理多个网站的内部链接策略,LinkBoss 都可以助你一臂之力。详细报告可帮助你全面了解网站的情况。
|