登录
|
注册
公司
标签
文章
搜索
百度
机器学习
所有
有回答
没回答
新题目
有最佳答案
排序
热度
·
时间
·
经典指数
1
0
2616
如何判定训练出的模型过拟合? ...
阅读题目
百度
机器学习
问答题
经典指数
1
0
2616
在一个无线大平面上,有两组平行线,互相间垂直,每组平行线的间隔都为t,将一根长度为l(l ...
阅读题目
百度
机器学习
概率统计
问答题
经典指数
1
1
2057
韩梅梅和李雷是百度的实习生,他们刚入职就接受了一项任务,用机器学习的方法来预测某个行业query和广告之间的点击率。该模型将会用于对广告展现时,根据点击率,对展现的广告做重排序。他们两个都采用了LR方法来解决问题,具体的做法是: (1)根据一个月该行业的日志,找到每次搜索时,当时展现的所有广告(一次展现固定出三条广告)。他们把每个广告的每次展现当作样本,当时是否点击为LR的y值:0或者1。这样一共获得了50w个样本(比如在一次搜索queryA下展现了三条广告a,b,c,其实a被点击了一次,那么这次搜索一共对应3个样本,其中第一个样本的y为1,后面两个样本的y为0) (2)对样本做均匀抽样分成两份,70%为训练样本,30%为测试样本,抽取了100种特征,其中一个特征是当时广告在网页中的排序(1,2或者3) (3)使用公司的LR在训练样本上进行训练,在测试样本中进行检测, 认为LR模型给出的p即为广告的点击率,其中 a.对于广告在网页中的排序,韩梅梅使用的方法是离散乘0-1特征,即将排序离散成(是否为第一名,是否为第二名,是否为第三名),如果样本的排序是第一名,对应的特征为(1,0, ...
阅读题目
百度
机器学习
问答题
经典指数
1
2
18
题目数
1
贡献者
13
答案数
扫描后移动端查看
我也分享一个题目
"百度"公司热门职位
研发工程师
C语言工程师
产品经理
数理统计
自然语言处理
数据挖掘
测试工程师
C#工程师
Android
Hadoop
"机器学习"
职位热门公司
阿里巴巴
搜狐
网易
美团
奇虎360
京东
×
登录
注册
找回密码
记住登录
登录
快速注册
直接第三方登录