20240710 全新TTT架构:挑战Transformer和Mamba的霸主地位
🦉 AI新闻
🚀 全新TTT架构:挑战Transformer和Mamba的霸主地位
摘要:斯坦福、UCSD、UC伯克利和Meta研究人员提出了一种全新架构TTT层,取代RNN的隐藏状态,通过梯度下降压缩上下文。TTT层直接替代注意力机制,表现力更强且复杂度更低。TTT-Linear和TTT-MLP在扩展性和性能上超越现有的Transformer和Mamba,为长上下文建模提供了新方式,未来可用于长视频处理。
🚀 阿里云开源语音识别与生成模型
摘要:阿里云在7月9日宣布开源两款语音基座模型SenseVoice和CosyVoice。SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测,训练数据超过40万小时,支持50多种语言,并且在富文本识别和高效推理方面表现卓越。CosyVoice则在多语言、音色和情感控制方面表现出色,支持多功能语音生成。
🚀 腾讯智影小程序上线AI视频风格化功能
摘要:IT之家7月9日消息,腾讯智影小程序新增智影AI视频功能,可一键生成风格化视频,目前仅限日漫风格且限时免费。该功能在原视频基础上进行风格化处理,提升视频美感和传播力。智影AI支持多种模板,增加视频多样性。腾讯智影于2023年3月上线,集成虚拟数字人、智能去水印等多种功能。
🚀 商汤科技Sensechat向香港用户免费开放
摘要:7月9日消息,商汤科技宣布,其Sensechat手机App及网页版向香港用户免费开放。Sensechat基于粤语版多模态大模型,用户可用粤语进行文字或语音交流,支持问问题、搜索、生成图片、写文案等功能。iPhone用户可通过App Store下载,Android版本即将推出。网页版支持多模态文件处理和长文本生成。
🚀 360 儿童手表 A9 AI 红衣版发布
摘要:360 儿童手表 A9 AI 红衣版今日开售,售价 999 元。手表内置 AI 大模型,具备答疑解惑、教学辅导、AI 绘画等功能,并预装微信儿童版和 QQ。具备 10 重定位、SOS 告警、食品级环保材料和 2ATM 防水等特点。配备 1GB+8GB 内存组合和 980mAh 电池,支持 800 万 + 500 万像素双摄。
更多AI工具 Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621