单选题
1431.在强化学习中,什么是马尔可夫决策过程(MDP)的四个基本元素?
A
状态.动作.策略.回报
B
节点.边.路径.奖赏
C
模型.数据.训练.测试
D
初始化.迭代.收敛.优化
答案解析
正确答案:A
相关知识点:
MDP四元素是状态动作等
题目纠错
人工智能训练师题库
相关题目
单选题
3421.下列属于中国计算机互联网的有()
单选题
3420.定义类如下:classhello():defshowInfo(sef):print(self.x)下面描述正确的是
单选题
3419.下列有关于存储器的叙述中()是错误的
单选题
3418.在深度学习模型训练中,哪些技术可以用于防止梯度爆炸和提高稳定性:
单选题
3417.下列哪些是监督学习的算法?
单选题
3416.相对化学沉淀等传统工艺而言,萃取工艺的主要优点是()。
单选题
3415.在自然语言处理任务中,哪些技术可以用于改善命名实体识别的效果:
单选题
3414.一个完整的人工神经网络包括()。
单选题
3413.在深度学习中,哪些方法可以用于减轻梯度消失或爆炸问题:
单选题
3412.下列计算机应用领域中()是属于辅助工程的
