softmax是为了解决归一问题凑出来的吗?和最大熵是什么关系?最大熵对机器学习为什么非常重要?

  Рет қаралды 12,368

王木头学科学

王木头学科学

3 жыл бұрын

什么是softmax?
如何用最大熵原理推出softmax和sigmoid?
顺便了解,概率论里的矩,条件熵。
最大熵、极大似然法、交叉熵3种方法是等价的。

Пікірлер: 17
@xylineone
@xylineone 2 жыл бұрын
很好的内容希望视频主能继续坚持做下去
@user-nr8oi6nv3r
@user-nr8oi6nv3r 3 ай бұрын
耶看完了 要再複習一下交叉 感謝
@LichengBao-to6eb
@LichengBao-to6eb Жыл бұрын
非常棒!
@chenning1799
@chenning1799 2 жыл бұрын
我感觉你说到1个分类和2个分类的区别,好像不怎么合适。其实,我觉得1个分类跟2个分类从概率来说,分别不大。一个分类,你给到的标签是非此即彼,其实也算是2类,一个是正确的分类,一个是错误的分类,总概率也是1,只是我们只需要求出正确的分类的概率。而两个分类问题,如果这两类不能构成一个集合,那么这应该算是三分类的问题,但如果你从softmax来定义,那么你就默认了这两分类就是构成一个集合。所以这两分类跟一分类是一样的,都是非此即彼。我觉得你哪怕用sigmoid求都可以,因为知道一个概率后,另一个自然而然就知道了。
@yutingchang9735
@yutingchang9735 4 күн бұрын
為什麼不乾脆中間不用relu?如果relu是為了避免sigmoid/softmax梯度消失,其實relu也很像線性方程式,中間層直接不使用激活函數,最後一層再套用sigmoid/softmax是否一樣效果?
@ixy6864
@ixy6864 2 жыл бұрын
23:32 傅里叶变换与概论密度函数共轭!!!
@ztc106
@ztc106 2 жыл бұрын
46:01 裡的式子都必須都為 0,是因為「對所有可能的 x,P(tilde)(x) > 0 都成立」嗎?
@hxie9881
@hxie9881 2 жыл бұрын
filter 的值怎样定义?有一定的标准码?
@weizhang5023
@weizhang5023 11 ай бұрын
👍👍👍
@user-rt7lh9gx3o
@user-rt7lh9gx3o Жыл бұрын
最大墒得出softmax的形式,那这里面的eq,ep的想等的约束,和最后的误差最小,是一回事?
@weizhang5023
@weizhang5023 11 ай бұрын
文档可以分享吗
@masonalex3000
@masonalex3000 8 ай бұрын
对于任意x, y 式子恒为0,那么每一项都必须为0,不然就不是对于任意 x, y
@user-om8xh5de7y
@user-om8xh5de7y 2 жыл бұрын
在你研究的科学的人工智能智商超高常人前,教会它伦理道德。
@jameshu497
@jameshu497 2 жыл бұрын
softmax为什么要使用指数,而不是平方?王老师是否有研究过?我的直觉是平方容易产生0,其次可能指数能让梯度更大,平方不利于收敛
@dediver832
@dediver832 3 ай бұрын
平方不是单调的啊
@minglee5164
@minglee5164 10 ай бұрын
42:50 处,感觉原问题才是max min吧
@joetsai4676
@joetsai4676 2 жыл бұрын
因为这几项不相关啊,所以只能是都为零相加才能保证为零
ОСКАР vs БАДАБУМЧИК БОЙ!  УВЕЗЛИ на СКОРОЙ!
13:45
Бадабумчик
Рет қаралды 6 МЛН
ПРОВЕРИЛ АРБУЗЫ #shorts
00:34
Паша Осадчий
Рет қаралды 6 МЛН
Smart Sigma Kid #funny #sigma #comedy
00:26
CRAZY GREAPA
Рет қаралды 6 МЛН
教科书为什么反人性?我们还可以如何学?
23:54
王木头学科学
Рет қаралды 3,3 М.
最小二乘法,它怎么用,又是如何推出来的
9:59
小黑黑讲AI
Рет қаралды 573
Softmax Function Explained In Depth with 3D Visuals
17:39
Elliot Waite
Рет қаралды 35 М.
7. 程序员的性格为什么那么轴,那都是有原因的
29:47
王木头学科学
Рет қаралды 5 М.
什么是卷积神经网络?卷积到底卷了啥?
15:56
妈咪说MommyTalk
Рет қаралды 77 М.
09 Transformer 之什么是注意力机制(Attention)
23:45
水论文的程序猿
Рет қаралды 10 М.
如何理解信息熵
12:25
Ele实验室
Рет қаралды 31 М.
Отдых для геймера? 😮‍💨 Hiper Engine B50
1:00
Вэйми
Рет қаралды 1,3 МЛН
Top 50 Amazon Prime Day 2024 Deals 🤑 (Updated Hourly!!)
12:37
The Deal Guy
Рет қаралды 1,4 МЛН
Как распознать поддельный iPhone
0:44
PEREKUPILO
Рет қаралды 2,1 МЛН
iPhone, Galaxy или Pixel? 😎
0:16
serg1us
Рет қаралды 926 М.