首页   

AI日报:阿里春招3000岗位AI相关占50%;DeepSeek开源DualPipe与EPLB技术;豆包APP推照片动起来功能

AIbase基地  · 科技自媒体 AI  · 9 小时前

主要观点总结

AI日报 2月27日总结了AI领域的多个重要新闻和进展,包括DeepSeek发布并行策略升级、阿里巴巴春季实习生招聘、ElevenLabs发布语音转文本模型、微软推出Phi-4多模态与迷你模型等。文章涵盖了自然语言处理、机器学习等多个方向的技术进展和行业动态。

关键观点总结

关键观点1: DeepSeek发布并行策略升级,旨在解决大规模语言模型训练中的核心问题,提升计算效率和资源利用率。

DeepSeek在其开源计划的第四天推出了优化并行策略,包括双向管道并行算法DualPipe和动态负载均衡器EPLB技术。这些技术解决了混合专家模型中的热点专家问题,提高了整体利用率。同时,计算-通信重叠优化工具提高了时空效率,减少了端到端训练耗时。

关键观点2: 阿里巴巴启动春季实习生招聘,开放超过3000个岗位,其中近50%与人工智能相关。

阿里巴巴的春季实习生招聘涵盖了多个部门,显示出对AI技术的重视。AI岗位在高德和阿里云等部门的比例尤为显著。

关键观点3: ElevenLabs发布语音转文本模型Scribe,支持99种语言,准确率高。

Scribe v1模型能够在复杂音频环境中准确区分不同说话者,定价合理,未来有进一步的低延迟版本。

关键观点4: 微软推出Phi-4多模态与迷你模型,集成语音、视觉和文本处理。

Phi-4多模态模型参数达到5600万,在多项基准测试中表现优异。Phi-4迷你模型则专注于文本处理,参数为3800万,表现同样出色。

关键观点5: Hugging Face推出FastRTC,简化实时音频和视频AI应用的开发过程。

FastRTC是一个开源的Python库,能够在几行代码内创建基本的实时应用,促进了更加自然的人机交互方式。

关键观点6: 其他多个领域的进展和新闻,包括节点式AI画布、OpenAI GPT-4.5的推出、字节跳动AI智能助手的功能等。

这些进展和新闻展示了AI领域的多样性和快速发展。


正文

AI日报

2月27日•AIbase

1、DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练革命

2、阿里启动2026届春招,开放3000岗位AI相关占近50%

3、ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%

4、微软发布 Phi-4 多模态与迷你模型,语音视觉文本处理再升级

5、Hugging Face 推出 FastRTC:实时语音视频应用开发变得轻而易举

6、FLORA节点式 AI 画布:简化从故事分析到视觉内容生成创意工作流

7、发布在即?OpenAI GPT-4.5出现在Android应用测试版

8、字节跳动AI智能助手豆包APP推出“照片动起来”功能

9、B站文本转语音模型IndexTTS :支持拼音纠正汉字发音、精准控制停顿

10、快手可灵AI 1月全球访问用户环比增长113%

11、大学老师说AI作文全判0分

12、19岁女棋手因AI作弊,被中国围棋协会重罚禁赛8年

13、Anthropic 开放 Claude AI GitHub 集成,助力开发者代码效率


1. DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练革命


DeepSeek在其开源计划的第四天推出了优化并行策略,重点包括双向管道并行算法DualPipe和动态负载均衡器EPLB。这些技术旨在解决大规模语言模型训练中的核心问题,显著提升计算效率和资源利用率。



亮点提要:

🔄 DualPipe算法实现双向数据流管道,提升计算吞吐量,适用于千亿至万亿参数规模的模型训练。

⚖️ EPLB动态负载均衡器解决了混合专家模型中的热点专家问题,整体利用率提升至92%以上。

📊 计算-通信重叠优化工具构建了时空效率模型,减少约15%的端到端训练耗时。

详情入口:

🔗 https://github.com/deepseek-ai/DualPipe




2. 阿里启动2026届春招,开放3000岗位AI相关占近50%


阿里巴巴正式启动2026届春季实习生招聘,开放超过3000个岗位,其中近50%与人工智能相关。AI岗位在某些部门的比例更高,如高德达65%和阿里云超过80%。此次春招涵盖多个部门,显示出阿里对AI技术的重视和对技术类岗位的持续关注,尤其是在AI领域。


亮点提要:

🤖 阿里巴巴启动2026届春季实习生招聘,开放3000个岗位,AI相关岗位占比近50%。

📈 在高德和阿里云等部门,AI岗位比例显著,分别达到65%和80%。

💼 阿里AI To C业务已开始大规模招聘,90%岗位集中在AI技术和产品研发。




3. ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%


ElevenLabs 最近推出了其最新的语音转文本模型 Scribe v1,声称在多种语言中达到了最高的准确性。该模型支持99种语言,能够在复杂音频环境中准确区分多达32位不同说话者。Scribe 的定价为每小时0.40美元,并在未来六周内提供50%的折扣。


亮点提要:

🌟 Scribe v1是 ElevenLabs 最新推出的语音转文本模型,准确率在多语言中创下新高。

🗣️ 支持99种语言,能够区分多达32位不同的说话者,适应复杂音频环境。

💰 当前定价为每小时0.40美元,未来六周享受50%折扣,低延迟版本正在开发中。

详情入口:

🔗 https://elevenlabs.io/blog/meet-scribe




4. 微软发布 Phi-4 多模态与迷你模型,语音视觉文本处理再升级


微软最近推出了Phi-4系列的新模型,包括Phi-4多模态和Phi-4迷你,Phi-4多模态模型集成了语音、视觉和文本处理,参数达到5600万,在多项基准测试中表现优异,尤其是在自动语音识别和翻译任务中表现突出。Phi-4迷你则专注于文本处理,参数为3800万,表现同样出色。


亮点提要:

🎤 Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构模型,参数达到5600万,表现超越许多竞争对手。

📊 在视觉处理和数学推理方面,Phi-4多模态模型表现出色,能够有效理解文档和图表,并执行光学字符识别。

📝 Phi-4迷你模型专注于文本处理,参数为3800万,在文本推理和编程等任务中表现卓越,超越多款流行的大型语言模型。

详情入口:

🔗 https://www.chinaz.com/ainews/15766.shtml




5. Hugging Face 推出 FastRTC:实时语音视频应用开发变得轻而易举


Hugging Face 最近推出了 FastRTC,一个开源的 Python 库,旨在简化开发实时音频和视频 AI 应用的过程。该库通过自动化复杂的实时通信功能,使得开发者能够在几行代码内创建基本的实时应用,从而大幅缩短开发时间。


image.png


亮点提要:

🎉 Hugging Face 推出 FastRTC,一个开源的 Python 库,旨在简化实时音频和视频 AI 应用的开发过程。

⚡ FastRTC 能够在几行代码内完成以往需要数周的工作,使得现有的 Python 开发者也能轻松构建语音和视频功能。

🌟 该库的发布为 AI 界带来重大机遇,促进了更加自然的人机交互方式,帮助企业更快速地满足用户需求。

详情入口:

🔗 https://huggingface.co/fastrtc




6. FLORA节点式 AI 画布:简化从故事分析到视觉内容生成创意工作流


FLORA最近推出的节点式AI画布是一款专为创意专业人士设计的工具,旨在通过整合多种AI功能,简化创意流程。其核心在于节点式系统,用户可创建独立节点处理不同任务。FLORA的故事分析与提示生成、角色设计工具以及团队协作功能,使得创意工作更高效且灵活。



亮点提要:

🖌️ 节点式系统允许用户独立处理不同创意任务,提升工作效率。

📖 故事分析与角色设计工具能生成详细提示,便于使用高级AI图像生成器。

🤝 支持团队实时协作,界面友好,适合技术背景不深的用户。




7.  发布在即?OpenAI GPT-4.5出现在Android应用测试版


OpenAI正在为其新一代语言模型GPT-4.5的预览版做准备,引发了广泛关注。该模型将在ChatGPT的Android应用中作为实验性选项推出,最初将专门向Pro订阅用户提供。尽管具体功能尚不明确,但GPT-4.5有望成为ChatGPT免费版的继承者,功能上可能会有更高的通话限制。


image.png


亮点提要:

🚀 GPT-4.5即将推出,最初将面向Pro订阅用户。

🔍 该模型在ChatGPT的Android应用中作为实验性选项出现,具体功能尚不明确。

💰 Pro订阅费用为每月200美元,提供更多功能和更少限制。




8. 字节跳动AI智能助手豆包APP推出“照片动起来”功能


字节跳动旗下的豆包APP推出了“照片动起来”功能,旨在将静态老照片转化为动态视频。用户只需上传照片并描述动作,便可轻松实现这一转变。此功能不仅为用户的记忆增添了生动的色彩,也为珍贵的瞬间赋予了新的生命,体现了科技与情感的结合。

image.png


亮点提要:

📸 此功能允许用户将静态老照片转化为生动的动态视频,满足用户对老照片动态化的需求。

💡 操作简单,用户只需上传照片并描述其中的动作,便可生成动态效果。

❤️ 豆包APP希望通过此功能,帮助用户与过去的自己进行跨越时空的对话,留住美好瞬间。




9. B站文本转语音模型IndexTTS :支持拼音纠正汉字发音、精准控制停顿


B站推出的IndexTTS模型是基于XTTS和Tortoise的GPT风格文本转语音系统,具备独特的拼音纠正汉字发音能力和精准的停顿控制。经过数万小时的数据训练,IndexTTS在字词错误率和音质评测中表现优异,超越了多款流行的TTS系统,展示了行业领先的性能。

亮点提要:

🌟 IndexTTS是基于XTTS和Tortoise的GPT风格TTS模型,能够纠正汉字的发音并控制停顿。

📊 系统经过数万小时训练,超越了多个现有的流行TTS系统,展现出行业领先性能。

🔍 IndexTTS在多项评测中表现优异,字词错误率和音质均优于其他模型,显示其强大优势。

详情入口:

🔗 https://github.com/index-tts/index-tts




10. 快手可灵AI 1月全球访问用户环比增长113%


根据最新数据,快手可灵AI在1月份的全球月访问用户数环比增长了113%。瑞银指出,在线娱乐和教育是AI应用的核心领域,而快手凭借其自主研发的可灵AI在全球视频生成模型中处于领先地位。


亮点提要:

📊 快手可灵AI在1月全球月访问用户数增长113%。

🎓 在线娱乐与教育是AI落地的关键场景。

🖼️ 可灵AI新上线的多图参考功能支持用户上传多张参考图片。




11. 、大学老师说AI作文全判0分网友:过度依赖造成思维惰性


随着人工智能技术的迅速发展,AI工具成为大学生完成报告和论文的助手。然而,部分高校教师指出,依赖AI生成内容的学生中存在学术不端行为,学校因此出台政策,若学生提交AI生成的作文,将被判定为零分。这一措施旨在强调学术诚信,反对过度依赖技术。


亮点提要:

📚 部分高校教师指出,依赖AI生成内容的学生中存在学术不端行为。

🚫 学校出台政策,若学生提交AI生成的作文,将被判定为零分。

🧠 网友对此反应不一,支持与担忧并存,强调学术诚信的重要性。




12. 19岁女棋手因AI作弊,被中国围棋协会重罚禁赛8年


中国围棋协会对职业棋手秦思玥因在全国围棋锦标赛中作弊行为作出严厉处罚,撤销其职业段位并禁赛八年。秦思玥在比赛中携带手机,利用人工智能程序作弊,情节严重,且在被询问时隐瞒事实。


亮点提要:

📱 秦思玥在比赛中使用手机和人工智能程序进行作弊,情节严重。

🚫 中国围棋协会决定撤销秦思玥的职业段位,并取消其比赛成绩。

⏳ 秦思玥被禁止参加围棋赛事和活动长达八年,以维护行业公平。




13. Anthropic 开放 Claude AI GitHub 集成,助力开发者代码效率


近日,Claude 关系负责人 Alex Albert 宣布 Claude 全面开放 GitHub 集成功能,面向所有用户,包括免费用户、Pro 用户以及团队用户。这一新功能的推出,意味着开发者们在日常的编码、测试与调试工作中将拥有更强大的工具支持,能够更高效地进行项目开发。


image.png


亮点提要:

🚀 Claude AI 现已开放 GitHub 集成,所有用户均可使用,提升开发效率。

💻 开发者可以将代码库同步至 Claude,享受更强的代码分析与调试支持。

⚠️ 免费用户需注意配额消耗,而 Pro 用户则能更好地控制使用情况。l


           

点击阅读原文,进AIbase官网.

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com