答案:B
A. 最小二乘法是通过最小化预测值y和真实的y在训练数据上的误差来寻找最优解的方法$;$当自变量X的特征很多的时候,使用最小二乘法可以求得最优解$;$最小二乘法是通过求导来找出最优解,是一种迭代的方法$;$使用最小二乘法求最优解比梯度下降方法好
A. 文本识别$;$机器翻译$;$文本分类$;$问答系统
A. 泛化能力$;$过拟合$;$欠拟合$;$正则化
A. 隐藏层层数增加,模型能力增加$;$Dropout的比例增加,模型能力增加$;$学习率增加,模型能力增加$;$都不正确
A. 1.2.3.4$;$1.3.4.6$;$1.2.3.4.5.6$;$3.4.6
A. 大数据是一种思维方式$;$大数据不仅仅是讲数据的体量大$;$大数据会带来机器智能$;$大数据的英文名称是largedata
A. 封装$;$ 继承$;$ 多态$;$ 重复
A. 正确$;$错误
A. 自注意力$;$Normalization$;$全连接$;$卷积