新闻
您现在的位置:首页 > 新闻 > Facebook的ReAgent是用于强化学习和推理AI的工具包
  • 振东制药达霏欣创新推出“内服外治”方案:焕活毛囊新生

    振东制药达霏欣创新推出“内服外治”方案:焕活毛囊新生

    发布时间:2025/07/24

    近年来,随着生活压力加剧、作息不规律及环境因素影响,脱发、白发问题呈现年轻化趋势,成为困扰现代人的普遍健康难题。面对庞大的市场需求,传统单一治疗手段逐渐显露出局限性。近日,专注毛发健康领域22年的达...

  • 和平精英上线具有长期记忆的AI明星队友

    和平精英上线具有长期记忆的AI明星队友

    发布时间:2025/07/14

    《和平精英》六周年新版本限时模式推出的“绝地指挥”玩法,凭借玩家与AI队友组队的创新体验,收获了如潮好评。如今,“绝地指挥2.0”迎来重磅升级!腾讯游戏首位具有长期记忆能力的明星AI队友——“花傲天”正式登场!7...

  • 振东集团的”本草革命”:让中药材跳出药罐子,闯出大健康新天地

    振东集团的”本草革命”:让中药材跳出药罐子,闯出大健康新天地

    发布时间:2025/06/10

    红球纷飞传三晋,大爱无边漫九州。5月25日,由中国红十字会总会主办,山西振东健康产业集团赞助的“红气球挑战赛”(晋中站)在山西省高校新区(山西大学城)鸣笛开赛。该赛事汇聚了来自全国各地及山西大学城高校的...

  • 振东集团:32年慈善长跑背后的“共富密码”

    振东集团:32年慈善长跑背后的“共富密码”

    发布时间:2025/06/03

    在商业与公益的天平上,山西振东健康产业集团选择了后者——即便负债也要坚持的”变态慈善”。这家从太行山走出的民营企业,用32年时间构建起一套独特的公益生态系统,累计捐赠超10亿元,将”与民同...

  • 第三批专项债六月底发完 项目完成审核

    第三批专项债六月底发完 项目完成审核

    发布时间:2020/04/06

    财政部副部长许宏才4月3日在新闻发布会上表示,今年以来,根据全国人大常委会授权,财政部提前下达了2020年部分新增专项债券额度12900亿元。截至2020年3月31日,全国各地发行新增专项债券1.08万亿元,占84%,发行...

  • 国美零售转型加速 携拼多多“迎战”零售业大考

    国美零售转型加速 携拼多多“迎战”零售业大考

    发布时间:2020/04/06

    随着国内疫情初步得到控制,零售消费市场也在逐渐恢复运转。日前,国务院联防联控机制举办新闻发布会。商务部消费促进司负责人王斌在会上指出,将千方百计促进消费回补和潜力释放,壮大新型消费和升级消费,扩大...

  • 美新冠疫情蔓延,建霖家居等IPO企业受累

    美新冠疫情蔓延,建霖家居等IPO企业受累

    发布时间:2020/04/06

    编者按: 随着疫情蔓延,全球新冠肺炎确诊病例已突破百万,累计死亡超5万例,其中,美国确诊超过23万例,欧洲确诊超过50万例。作为全球经济重要力量的欧美地区,其疫情将对IPO企业产生什么影响? “有一天美国将成...

  • 信托代销哪家强?招行去年赚64亿

    信托代销哪家强?招行去年赚64亿

    发布时间:2020/04/04

    证券时报记者 杨卓卿 随着银行年报密集披露,一些行业巨头代销信托产品的情况也浮出水面。 证券时报记者注意到,“零售之王”招商银行2019年代销的信托产品规模超过3000亿元,借此实现64.32亿元的手续费及佣金收入...

Facebook的ReAgent是用于强化学习和推理AI的工具包

发布时间:2019/10/18 新闻 浏览次数:966

 
Facebook AI Research今天推出了ReAgent,这是一种增强型学习工具包,用于构建可以接收反馈的决策AI。 ReAgent可以将分数分配给用户操作,并将用户输入(例如单击推荐内容)作为训练数据。
ReAgent是一个小型C ++库,可以在GitHub上下载,该库旨在嵌入任何应用程序中。该工具包包含一组入门的决策AI模型,一个用于模型性能评估的离线模块,以及一个使用PyTorch中的TorchScript库将AI部署到生产中的平台。
Horizo​​n是强化学习平台,用于在Facebook于2018年11月开源的生产中部署大型模型,现已成为ReAgent的一部分。
应用研究主管Srinivas Narayanan今天在Facebook的@Scale会议上说,ReAgent目前每天用于在Facebook上个性化数十亿个决定,例如针对Facebook和Instagram的用户通知。它还在机器人技术研究中使用了如何教机器走路的方法。
Facebook在博客中说:“它是用于创建基于AI的推理系统的最全面,模块化的开源平台,并且是第一个包含策略评估的策略,该策略结合了离线反馈以改进模型。” “通过使构建实时,大规模决策的模型变得更加容易,ReAgent使研究项目以及生产应用中策略的创建和评估民主化。”
为了继续改进ReAgent,Facebook发布了有关如何部署到Microsoft Azure等云服务的文档。微软的Azure认知服务于今年初推出了自己的强化学习服务。
该消息是在Facebook的PyTorch开发者大会之后一周发布的,该公司在该大会上介绍了Captum,这是一种用于解释机器学习的工具。
在今年夏天VentureBeat的Transform会议上的一次对话中,OpenAI首席技术官Greg Brockman和首席科学家Ilya Sutskever认为,推理和可解释性应该是未来AI模型的核心。

姓 名:
邮箱
留 言: