搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
GitHub
28 天
tjuDavidWang/HW-DQN-2048
本项目主要探讨了深度Q网络(DQN)在2048游戏中的应用。开发了一个基于DQN的代理(agent),使其能自主玩2048游戏并优化策略。 在notebook中,按照顺序执行每个cell,其中包括配置环境、定义模型、训练模型、使用模型推理游戏等步骤。 可以修改的部分包括但不限于 ...
GitHub
24 天
README.zh.md
Gumbel MuZero和 MuZero在不同模拟次数下,在四个环境(PongNoFrameskip-v4, MsPacmanNoFrameskip-v4, Gomoku和 LunarLanderContinuous-v2)上的基线结果: Stochastic MuZero和 MuZero在具有不同随机性程度的2048环境(num_chances=2/5) 上的基线结果: 以下是关于 MCTS ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
今日热点
Hush money sentencing set
Reelected as speaker
Biden blocks US Steel sale
FBI: Attacker acted alone
Denver lands NWSL team
Union hire new coach
ISR to resume ceasefire talks
Postal worker fatally stabbed
Colorado wolf death probe
Calls to 'open up' North Sea
Space debris lands in Kenya
The Osmonds singer dies
Net neutrality rules blocked
Polar vortex 2025
NY inmate death probe
Issues 4th oyster warning
Plane slams into warehouse
Pipe bomb case: New details
US Army veteran indicted
Remains found after 6 yrs?
JetBlue hit with $2M fine
2nd Utah agent charged
Jan. 6 panel leaders awarded
EU diplomats visit Syria
Ultra-processed foods probe
Retracts Glastonbury exit
Calls for cancer warnings
Marks judicial confirmations
To visit New Orleans
Won't face DOJ referral
反馈