搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 7 天
时间不限
过去 1 小时
过去 24 小时
过去 30 天
按相关度排序
按时间排序
来自MSN
4 天
极限压缩380倍!比OpenAI的Whisper更高效,开源模型超2000颗星
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! OpenAI开源的Whisper一直是很多开发者首选的语音识别模型。但它使用固定长度的编码器来处理 30 秒的音频块,对于较短的音频序列需要进行零填充。但这种填充即使输入音频非常短时也会产生恒定的算力负担,从而增加总处理时间并降低效 ...
爱范儿
6 天
刚刚,OpenAI 重磅发布 o3!再次突破 AI 极限,北大校友参与研发
使用微信扫码将网页分享到微信 就在刚刚,OpenAI 迎来了年底 AI 春晚的收官之作。 这次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国 ...
少数派
4 天
OpenAI 发布推理模型 o3
12 月 20 日,OpenAI 宣布推出 o3 系列模型,作为今年早些时候发布的 o1 模型后续型号。o3 包含 o3 和 o3-mini 两个版本,后者是针对特定任务微调的精简版模型。(跳过 o2 是为了回避同名英国电信运营商。) OpenAI 声称,o3 在特定条件下展现出接近通用人工智能(AGI ...
GitHub
6 天
README_zh.md
本项目基于开源项目 FunClip(由 阿里巴巴达摩院提供),在此基础上进行了功能修改,项目功能包含: ASR 总结功能:通过 LLM(如 OpenAI GPT、自定义 API)进行语音识别结果的总结。 动态 SRT 替换:支持通过映射规则替换字幕中的说话人标识。 轻量级部署 ...
站长之家
4 天
经典美剧《生活大爆炸》上线B站 部分字幕屏蔽 内容删减
不过,也有网友反馈剧中部分字幕被屏蔽,敏感词字幕被替换为***”,甚至有的连英文原字幕也一起被和谐,并且内容也有所删减。 据了解,《生活大爆炸》是哥伦比亚广播公司出品的电视喜剧,共12季,第一集于2007年9月24日在哥伦比亚广播公司首播,最后一集 ...
51CTO
4 天
如何使用 Gemini API 构建视频字幕生成器
Gemini 是多模态模型,它支持用户使用各种类型的输入,例如文本、图像、音频和视频等。 它擅长分析和处理大量文本,特别是从视频中提取信息的能力,非常适合字幕生成器的项目。 如何获取 API 密钥 API 密钥充当唯一标识符并验证你对服务的请求。它对于访问 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈