每个乐曲就是一个音轨多任务就是将不同音轨的乐谱还原出来-好居网

首页 |行业资讯|房产快讯|房企品牌|楼市观察|时尚健身|好居风水|生活美食|娱乐艺术|装修环保|亲子健康|建材资讯|五金家电|家居科技


	您的位置：好居网>>新闻>每个乐曲就是一个音轨多任务就是将不同音轨的乐谱还原出来每个乐曲就是一个音轨多任务就是将不同音轨的乐谱还原出来 2022-01-05 11:28:37 来源：IT之家阅读量：15892 　　导读：听一遍曲子，就能知道乐谱，还能马上演奏，而且还掌握十八般乐器，钢琴，小提琴，吉他等都不在话下这就不是人类音乐大师，而是谷歌推出的多任务多音轨音乐转音符模型MT3... 听一遍曲子，就能知道乐谱，还能马上演奏，而且还掌握十八般乐器，钢琴，小提琴，吉他等都不在话下这就不是人类音乐大师，而是谷歌推出的多任务多音轨音乐转音符模型 MT3 首先需要解释一下什么是多任务多音轨通常一首曲子是有多种乐器合奏而来，每个乐曲就是一个音轨，而多任务就是同时将不同音轨的乐谱同时还原出来事实上，谷歌 MT3 在还原多音轨乐谱这件事上，达到了 SOTA 的结果谷歌已将该论文投给 ICLR 2022 还原多音轨乐谱相比与自动语音识别，自动音乐转录的难度要大得多，因为后者既要同时转录多个乐器，还要保留精细的音高和时间信息。多音轨的自动音乐转录数据集更是低资源的现有的开源音乐转录数据集一般只包含一到几百小时的音频，相比语音数据集动辄几千上万小时的市场，算是很少了该模型在编码器和解码器中使用了一系列标准的 Transformer 自注意力块为了产生输出标记序列，该模型使用贪婪自回归解码:输入一个输入序列，将预测出下一个出现概率最高的输出标记附加到该序列中，并重复该过程直到结束生成的乐谱通过开源软件 FluidSynth 渲染成音频此外，还要解决不同乐曲数据集不平衡和架构不同问题实际效果在所有指标和所有数据集上，MT3 始终优于基线训练期间的数据集混合，相比单个数据集训练有很大的性能提升，特别是对于 GuitarSet，MusicNet 和 URMP 等低资源数据集最近，谷歌团队也放出了 MT3 的源代码，并在 Hugging Face 上放出了试玩 Demo。不过由于转换音频需要 GPU 资源，在 Hugging Face 上，建议各位将在 Colab 上运行 Jupyter Notebook。论文地址: 源代码: Demo 地址: 。声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。上一篇：他们预计这种情况将在2022年发生变下一篇：返回列表高级制表品牌为何偏极星成立战略合资企 [新闻]他们预计这种情况将在2022年发生变化部分原 [新闻]美国受一股向大西洋中部行进的冬季风影响遭遇暴 [新闻]建设银行北京齐园路支行负责人栾奇绩表示 [新闻]2021年北京市空气质量状况新闻发布会今日召 [新闻]嘉和美康：公司推出了智能医疗决策引擎等产品在 [新闻]2022年第一季度金银比先抑后扬金银比先抑后　推荐产品　经典回顾　1月3日周口市淮阳区新发现2例核酸初筛阳　00:00易方达基金庞亚平兴业证券张忆东　30:00东方基金2022·眺望新起点的　数字人民币App开放下载看看都有哪些特色　国家市场监督管理总局网站公布了《2021 　《爱情神话》保持口碑稳健的引发了网友对电　罗振宇的成长速度已经有点跟不上了　近日关注年轻力驱动下的商业地金地中心高频活动助力华为全屋智能战略发布云里物里AoA精准室京东方于2021年9月2日起正式实施　春节档动画电影《小虎　防盗门把手弹不回去怎　暖气片能烫伤吗以免灼　暖气柱式好板式好家里　李慧珍亮相湖南卫视跨　德善厨房原本是一家抗　河南禹州市紧急筹建5 　RiotBlockc
	网站地图备案号：京ICP备19048932号-2 中国最专业的房产家居、装修建材行业资讯网络平台本站部分资源来自网友上传，如果无意之中侵犯了您的版权，请联系本站，本站将在3个工作日内删除。