《一心·一艺》，以专注致敬传承，以匠心诠释永恒

发布时间：2025/11/05

2025年10月18日，在千年文脉与现代时尚交汇之地的杭州，哥本哈根皮草“臻萃之选”年度盛会隆重启幕。全球顶级皮草原料供应商哥本哈根皮草旗下的高端线上零售品牌联盟“臻萃之选”正式揭幕年度活动主题——“The Fur Code...
喜报！中科星图荣获“金牛奖”两项大奖，“创新与投资价值”载誉前行

发布时间：2025/11/02

10月29日，由中国证券报和南通市人民政府联合主办的2025上市公司高质量发展论坛暨第二十七届上市公司金牛奖颁奖典礼在南通市举办。本届评选中，中科星图股份有限公司（以下简称“中科星图”）荣获“2024年度最具投资...
振东制药达霏欣创新推出“内服外治”方案：焕活毛囊新生

发布时间：2025/07/24

近年来，随着生活压力加剧、作息不规律及环境因素影响，脱发、白发问题呈现年轻化趋势，成为困扰现代人的普遍健康难题。面对庞大的市场需求，传统单一治疗手段逐渐显露出局限性。近日，专注毛发健康领域22年的达...
和平精英上线具有长期记忆的AI明星队友

发布时间：2025/07/14

《和平精英》六周年新版本限时模式推出的“绝地指挥”玩法，凭借玩家与AI队友组队的创新体验，收获了如潮好评。如今，“绝地指挥2.0”迎来重磅升级！腾讯游戏首位具有长期记忆能力的明星AI队友——“花傲天”正式登场！7...

第三批专项债六月底发完项目完成审核

发布时间：2020/04/06

财政部副部长许宏才4月3日在新闻发布会上表示，今年以来，根据全国人大常委会授权，财政部提前下达了2020年部分新增专项债券额度12900亿元。截至2020年3月31日，全国各地发行新增专项债券1.08万亿元，占84%，发行...
国美零售转型加速携拼多多“迎战”零售业大考

发布时间：2020/04/06

随着国内疫情初步得到控制，零售消费市场也在逐渐恢复运转。日前，国务院联防联控机制举办新闻发布会。商务部消费促进司负责人王斌在会上指出，将千方百计促进消费回补和潜力释放，壮大新型消费和升级消费，扩大...
美新冠疫情蔓延，建霖家居等IPO企业受累

发布时间：2020/04/06

编者按：随着疫情蔓延，全球新冠肺炎确诊病例已突破百万，累计死亡超5万例，其中，美国确诊超过23万例，欧洲确诊超过50万例。作为全球经济重要力量的欧美地区，其疫情将对IPO企业产生什么影响？ “有一天美国将成...
信托代销哪家强?招行去年赚64亿

发布时间：2020/04/04

证券时报记者杨卓卿随着银行年报密集披露，一些行业巨头代销信托产品的情况也浮出水面。证券时报记者注意到，“零售之王”招商银行2019年代销的信托产品规模超过3000亿元，借此实现64.32亿元的手续费及佣金收入...

Facebook的ReAgent是用于强化学习和推理AI的工具包

发布时间：2019/10/18 新闻 浏览次数：0

Facebook AI Research今天推出了ReAgent，这是一种增强型学习工具包，用于构建可以接收反馈的决策AI。 ReAgent可以将分数分配给用户操作，并将用户输入(例如单击推荐内容)作为训练数据。
ReAgent是一个小型C ++库，可以在GitHub上下载，该库旨在嵌入任何应用程序中。该工具包包含一组入门的决策AI模型，一个用于模型性能评估的离线模块，以及一个使用PyTorch中的TorchScript库将AI部署到生产中的平台。
Horizon是强化学习平台，用于在Facebook于2018年11月开源的生产中部署大型模型，现已成为ReAgent的一部分。
应用研究主管Srinivas Narayanan今天在Facebook的@Scale会议上说，ReAgent目前每天用于在Facebook上个性化数十亿个决定，例如针对Facebook和Instagram的用户通知。它还在机器人技术研究中使用了如何教机器走路的方法。
Facebook在博客中说：“它是用于创建基于AI的推理系统的最全面，模块化的开源平台，并且是第一个包含策略评估的策略，该策略结合了离线反馈以改进模型。” “通过使构建实时，大规模决策的模型变得更加容易，ReAgent使研究项目以及生产应用中策略的创建和评估民主化。”
为了继续改进ReAgent，Facebook发布了有关如何部署到Microsoft Azure等云服务的文档。微软的Azure认知服务于今年初推出了自己的强化学习服务。
该消息是在Facebook的PyTorch开发者大会之后一周发布的，该公司在该大会上介绍了Captum，这是一种用于解释机器学习的工具。
在今年夏天VentureBeat的Transform会议上的一次对话中，OpenAI首席技术官Greg Brockman和首席科学家Ilya Sutskever认为，推理和可解释性应该是未来AI模型的核心。

上一篇: 微软的UniLM AI在摘要和语言生成方面达到了最先进的性能

下一篇: Giphy Arcade可让您播放，重新混合和共享基于GIF的“微型游戏”

相关推荐