大佬演讲2:李沐讲座
1 个人生涯
你想解决什么问题,导致你会去做什么事情。
2 打工人
公司也好,学校也好创造了一个比较简单的环境,待得越久,不是在一个更广的层次去思考一个问题。
3 PhD
博士还是看是否有研究价值,主要看个人追求,如果想要创造学术价值,并且真心热爱研究还是可以的,但是如果一心工作,读博士感觉很痛苦。
4 创业
所有的困难在你头上,逃避没有用,如果逃避它,就可能解决不了它。要热爱,才能真正做下去。
核心原因是有一个延迟享受,一个东西,可能5年之后才能得到正反馈。在没有立即正反馈的情况下,需要自己给自己加码,才能真正做下来这件事情。
5 动机
要有一个很强烈的动机,简单的欲望容易被满足,简单的恐惧容易被满足,一定要来自很深沉、很底层的欲望。
内心有什么特别不愿意分享出来的事情?
我感觉的话应该是有一些拖延的坏毛病,而且有的时候总是惯性思维,好像因为之前自己一直这么做,就下意识的去做一些事情。但是做一件事情之前,应该想一下是不是值得你去做这件事情。
想一下你背后的动机是什么?你是想要什么还是怕什么?直面自己的欲望,直面自己的恐惧。
需要把这种欲望和恐惧转换成向上的动机,动机一定是正 ...
如何成为一名优秀的推荐工程师
作为一名推荐工程师,所擅长的不应仅仅是机器学习相关知识,更应该从业务实践的角度出发,提升自己各方面的能力。
1 推荐工程师的 4 项能力抛开具体的岗位需求,从稍高的角度看待这个问题,一名推荐工程师的技术能力基本可以拆解成以下 4 个方面:知识、工具、逻辑、业务。
如果用技能雷达图的形式展示与机器学习相关的几个职位所需的能力,则大致如下图所示。
简单来说,任何推荐系统相关的工程师都应该满足 4 项技能的最小要求,因为在成为一名“优秀”的推荐工程师之前,首先应该是一名合格的工程师。不仅应具有领域相关的知识,还应具有把知识转换成实际系统的能力。推荐系统相关的从业者应该具有的最小能力要求如下:
知识:具备基本的推荐系统领域相关知识
工具:具备编程能力,了解推荐系统相关的工程实践能力
逻辑:具备算法基础,思考的逻辑性、条理性较强
业务:对推荐系统的业务场景有所了解
在最小要求的基础上,不同岗位对能力的要求也有所不同。结合上面的技能雷达,不同岗位的能力特点如下:
算法工程师:算法工程师的能力要求是相对全面的。作为算法模型的实现者和应用者,要求算法工程师有扎实的机器学习基础,改进和实现算法的 ...
面试记录3:MiniMax技术一面
1 面试背景
面试公司:MiniMax 大模型公司
面试岗位:大模型推荐&广告算法实习生
面试类型:技术一面
面试时间:2024-12-04 17:00~18:00
面试结果:通过 😊
2 整体感受
面试之前一点也不紧张,因为自己保研参加很多线下的面试,而且之前也参加过华为的面试等,所以心态不慌。
面试官刚进来的时候,一看就知道是个强者,前面的头发快没了,而且一副中年程序员的样貌。在面试的过程中还是挺放松的,也一直和面试官讨论技术问题。最后,面试管问我还有什么问题么?我就问了很多我自己关于推荐系统的思考,感觉很 nice,面试官也和我讨论了很多。
需要改进的地方:
自我介绍再背的熟一些
准备的再充分一些
感觉自己发挥的挺好的,没有什么硬伤,还有一些小细节需要优化吧。
3 提问的问题
面试官:你先介绍一下自己吧。
balabala………
3.1 Word2Vec
面试官:看到你参加了天池新闻推荐系统比赛,你可以说一下你是怎么用 Embedding 进行召回的吗?
我主要使用 2 种方法来进行 Embedding,分别是 Word2Vec 和 训练 YouTu ...
论文精读6:Llama3
Llama3
现代人工智能(AI)系统是由基础模型提供动力的。本文提出了一套新的基础模型,称为Llama 3。它是一群原生支持多语言、代码、推理和工具使用的语言模型。我们最大的模型是一个稠密的Transformer,具有405B参数和高达128K tokens的上下文窗口。本文对Llama 3进行了广泛的实证评价。我们发现,Llama 3在大量任务上提供了与GPT-4等领先语言模型相当的水平。我们公开发布了Llama 3,包括预训练和后训练的405B参数语言模型的版本,以及我们的Llama Guard 3模型的输入和输出安全。本文还介绍了我们通过合成方法将图像、视频和语音能力整合到Llama 3中的实验结果。我们观察到,这种方法在图像、视频和语音识别任务上与最先进的方法相竞争。生成的模型还没有被广泛发布,因为它们还在开发中。
1 Introduction基础模型是语言、视觉、语音或其他模式的通用模型,它们被设计用来支持大量的人工智能任务。它们构成了许多现代人工智能系统的基础。
现代基础模型的发展包括两个主要阶段:
预训练阶段:模型在大规模训练使用直接任务如单词预测或字幕
后训练阶段 ...
读书记录5:罪与罚
《罪与罚》是俄国作家陀思妥耶夫斯基创作的长篇小说,也是其代表作,于1866年的1月开始刊登在《俄国导报》上,1867年2月连载结束。
1 前言当时在看这本书的时候,一度不知道这本书要讲什么,后来看着看着就明白了。在看之前就知道这是一本压抑小说,看完了后给我的影响是巨大的。
2 经典语录
人这种卑鄙的东西,什么都会习惯的。
我唯一担心的是我们明天的生活能否配得上今天所承受的苦难。
“你为何不骂我,却拥抱我?” “因为世界没有比你更不快乐的人了。”
有时,一个人遇上强盗,整整半小时感到死亡的恐惧,最后,刀架到脖子上,反倒什么都不怕了。
大家都杀人,在世界上,现在杀人,过去也杀人,血像瀑布一样地流,像香槟酒一样地流,为了这,有人在神殿里被戴上桂冠,以后又被称作人类的恩主。
我只想证明一件事,就是,那时魔鬼引诱我,后来又告诉我,说我没有权利走那条路,因为我不过是个虱子,和所有其余的人一样。
世界上没有什么比直言不讳更难,也没有什么比阿谀奉承更容易的了。
要知道,女人就是这样,爱你也是她,害你也是她,两者并行不悖。
平凡的人必须听话,没有犯法的权利,因为,您要知道,他们是平凡的人。不平凡 ...
机器学习模型的可解释性
1 模型可解释性介绍如果机器学习的模型具有解释力的话,也可以凭借这个结果去修正我们的模型。未来的目标是知道为什么模型预测的结果很差,并且使用可解释的机器学习修正它。
1.1 Interpretable v.s. Powerful一些模型的解释性是很好的,例如线性模型,但是这种模型的能力较差。深度神经网络很难去解释,就像黑箱一样,但是效果远比线性模型要好。
就像决策树算法的可解释性和效果都很好,所以是不是我们只要使用决策树就可以了?当然不是,因为决策树也可以变得很复杂。就像在打 Kaggle 比赛时,通过不会使用一棵决策树,一般会用随机森林,这时候是很多棵决策树共同决定的结果。
1.2 可解释ML的目标可解释性一定要完全了解ML模型是如何工作的吗?例如,我们不完全知道大脑是如何工作的,但我们相信人类的决定。
一个好的可解释性就是给人一个理由去相信这么解释是对的,重点是人类能够理解模型是如何运行的。
1.3 可解释性的分类机器学习模型的可解释性分为局部可解释性和全局可解释性,以下图为例对局部可解释性和全局可解释性进行介绍:
局部可解释性:为什么这张图片是一只猫
全局可解释性:什么样 ...
读书记录4:人间失格
《人间失格》(又名《丧失为人的资格》)日本小说家太宰治创作的中篇小说,发表于1948年,是一部半自传体的小说。
1 前言在读这本书之前一直都知道这本书,读了之后才发现这是一个中篇小说,没有那么长,读完感触很深,其中生活中没有很多人那么关注你,所以你也没有必要去在意别人对你的评价。别人夸了你能怎么样,别人诋毁你又能怎么样,so what?
走自己的路,让别人说去吧。
2 经典语录
生而为人,对不起。
丑角本质上只是一层伪装,是为了自我保护而戴上的面具。
一有机会,人类可怕的真面目就会在愤怒中不经意地暴露出来。
在所谓人世间摸爬滚打至今,我唯一愿意视为真理的,就只有这一句话:一切都是会过去的。
我的不幸,恰恰在于我缺乏拒绝的能力。我害怕一旦拒绝别人,便会在彼此心里留下永远无法愈合的裂痕。
相互轻蔑却又彼此来往,并一起自我作贱,这就是也上所谓“朋友”的真面目。
相遇总是措不及防,离别都是蓄谋已久。我们要习惯身边的忽冷忽热,也要看淡那些渐行渐远。
每天面对同样的事情,不过度欢喜,自然就不会感到过度的悲哀。
我得死,我必须得死,活着便是罪恶的种子。
没有人在遭受别人责难与训斥时,还能愉快 ...
论文精读5:DNN for YouTube Rec
论文题目:Deep Neural Networks for YouTube Recommendations作者:Google发表时间:2016年
DNN for YouTube Rec
YouTube 代表存在规模最大、最复杂的工业推荐系统之一。在本文中,我们以顶层视角描述系统,并专注于深度学习带来的显着性能改进。本文根据经典的两阶段信息检索二分法进行分割:首先,我们详细介绍了深度召回模型,然后描述了单独的排序模型。我们还提供了从设计、迭代和维护大量具有巨大面向用户影响的推荐系统中获得的实际经验和见解。
1 介绍YouTube 是世界上最大的创作、分享和观看视频的平台。YouTube 的推荐系统负责帮助超过 10 亿用户从不断增多的视频库中找到自己感兴趣的内容。在本文中,我们将重点关注深度学习最近对 YouTube 视频推荐系统的巨大影响。图1展示了移动端YouTube在主页推荐视频的页面。
图 1:移动端YouTube在主页推荐视频的页面。
YouTube 的视频推荐遇到的困难主要有三个方面:
推荐的规模:许多现有的推荐算法被证明在小规模问题上工作良好,无法在我们的规 ...
Linux服务器使用clash配置VPN
之前配置过服务器的VPN,但是最近在一个新的服务器上重新配置的时候总是不成功。经过一番努力,最终成功配置VPN,特此记录。
1 下载 clash 安装包首先需要为服务器下载 clash 安装包,进入 Clash Releases 网站选择红色的两个其中之一进行下载。
如果服务器有界面,则可以直接使用服务器的浏览器进行下载。如果没有,则先使用自己的电脑下载后,传输到服务器中。
下载之后进行解压,得到文件 clash-linux-amd64-v3-v1.18.0。
1gunzip clash-linux-amd64-v3-v1.18.0.gz
使用 mv 命令将其重命名为 clash,方便之后使用。
1mv clash-linux-amd64-v3-v1.18.0 clash
之后增加 clash 程序执行的权限:
1chmod +x clash
此时还不能运行 clash,因为我们还少两个文件:
config.yaml:配置文件
Country.mmdb:包含 IP 地址到国家的映射,Clash 利用这个文件来识别用户的 IP 地址所在的国家或地区
接下来分别介绍如何获取这 ...
读书记录3:斯通纳
《斯通纳》是美国当代作家约翰·威廉姆斯创作的长篇小说,首次出版于1965年。
1 前言9月初的时候就读完了这本书,现在有时间写下读书感悟。这本书可以说是我的启蒙读物,在读这本书之前是没有读书的习惯,当时看这本书的时候感觉很有意思,里面有一些片段仿佛就是我的个人写照,一个人穷极一生,应该听从内心的召唤,活出自己的本色。
2 经典语录
爱不是最终目标而是一个过程,借助这个过程,一个人想去了解另一个人。
从长远看,各种东西,甚至让他领悟到这点的这份学问,都是徒劳和一场空,而且最终要消解成一片他们撼动不了的虚无。
我们最终还是属于这个世界,我们应该早知道这点。我相信我们是知道的,但我们得退出来一点,假装一点。
他发现自己有些迷茫,怀疑生活是否值得过下去,是否曾经有过生活。
斯通纳还非常年轻的时候,认为爱情就是一种身心的纯粹状态。
你必须牢记自己是什么人,你选择要成为什么人,记住你正在从事的东西的重要意义。
你对我的百般注解,构不成万分之一的我,却是一览无余的你。
感官突然被打开了,也就是诗突然找上了他,从此感受力都不一样了。
年纪更大些的时候,回首自己本科前两年,斯通纳仿佛感觉那段时光 ...