单选题
()不是解决探索-利用困境的常用方法。
A
ε-greedy策略
B
softmax策略
C
UCB(UpperConfidenceBound)算法
D
梯度下降算法
答案解析
正确答案:D
解析:
暂无解析
相关知识点:
探索利用困境,梯度下降非解
题目纠错
人工智能训练师题库_1500题
