English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
Understanding RLHF From Scratch
已浏览 2 次
5 个月之前
substack.com
RLHF: Understanding Reinforcement Learning from Hu
…
已浏览 3242 次
2024年9月18日
coursera.org
19:36
细节怪-手撕 LLM 之 RLHF 详解与 PPO 算法详解(2)本节是奖励函数
…
已浏览 1922 次
2 周前
bilibili
Beyond_April
0:07
Stack Implementation in Python Simplified | TanishkBhatt | #pytho
…
已浏览 405 次
1 个月前
YouTube
Tanishk Bhatt
1:26
List Object || Python Simplified || Solution
已浏览 69 次
2 周前
YouTube
Usmar
0:11
pop() || Python Simplified
已浏览 11 次
1 周前
YouTube
Usmar
0:14
Reference Object || Python Simplified
已浏览 285 次
2 周前
YouTube
Usmar
2:15
What is RLHF (Reinforcement Learning from Human Feedback)
…
已浏览 14 次
2 个月之前
YouTube
VLR Software Training
1:35
How AI Learns from You: RLHF Explained Simply!
2 个月之前
YouTube
Everyday AI Made Simple
0:10
Decorator in Python Simplified | TanishkBhatt | #python #coding #
…
已浏览 241 次
2 周前
YouTube
Tanishk Bhatt
24:29:14
Harvard CS50 (2026) – Full Computer Science University Cou
…
已浏览 31.4万 次
2 周前
YouTube
freeCodeCamp.org
2:40
Usmar Hyder || AI Specialist on Instagram: "String or Int 20 || Pyth
…
已浏览 487 次
1 周前
Instagram
usmar_hyder
20:28
RLHF: Training Language Models to Follow Instructions with Human F
…
已浏览 2127 次
2024年3月22日
YouTube
DataMListic
🐐Llama 3 Fine-Tune with RLHF [Free Colab 👇🏽]
已浏览 2万 次
2023年8月6日
YouTube
Whispering AI
9:17
【人工智能】AI会终结人类,但不会像《终结者》那样 | 杰弗里辛顿最新
…
已浏览 9336 次
10 个月之前
YouTube
最佳拍档
3:10:59
3小时超快速入门Python | 动画教学【2025新版】【自学Python教程】【
…
已浏览 24.2万 次
11 个月之前
YouTube
林粒粒呀
24:18
第三篇: 使用RLHF调整LLM(Tune an LLM with RLHF) 中英文字幕
已浏览 795 次
2023年12月25日
YouTube
Bob Lin
11:41
LLM大型语言模型如何进行微调? RLHF强化学习代码解读
已浏览 4477 次
2023年3月21日
zhihu.com
小工蚁创始人
51:29
InstructGPT和RLHF算法原理和实现分析
已浏览 404 次
7 个月之前
bilibili
kindlytrees
11:51
1小时速通 - 从强化学习到RLHF - OpenAI RLHF
已浏览 874 次
6 个月之前
bilibili
就要吃我就要吃
1:08
AI教父辛顿开喷RLHP8:它就是坨垃圾
已浏览 4.6万 次
10 个月之前
bilibili
智东西
4:28
Def Function in python simplified.
7 个月之前
YouTube
Programming champions
11:29
LLM系列之RLHF讲解
已浏览 307 次
2024年7月8日
bilibili
东土唐大哥
1:23:59
OpenRLHF:大规模分布式RLHF训练系统介绍
已浏览 3787 次
2024年9月1日
bilibili
NICE学术
27:25
RLHF实际上是如何工作的
已浏览 2852 次
2023年6月23日
bilibili
wharton0
4:41
1小时速通 - 从强化学习到RLHF - 21点
已浏览 1197 次
7 个月之前
bilibili
就要吃我就要吃
8:11
1小时速通 - 从强化学习到RLHF - 写在后面
已浏览 578 次
6 个月之前
bilibili
就要吃我就要吃
4:52
1小时速通 - 从强化学习到RLHF - 简介
已浏览 3125 次
7 个月之前
bilibili
就要吃我就要吃
6:34
1小时速通 - 从强化学习到RLHF - LLM in RL
已浏览 1147 次
6 个月之前
bilibili
就要吃我就要吃
1:00:06
LLM相关技术介绍之九-RLHF相关技术原理及实现介绍
已浏览 876 次
2024年8月29日
bilibili
kindlytrees
观看更多视频
更多类似内容
反馈