沈阳有感 沈阳甚是一个不讲道理的地方,我却要在这里讲一讲沈阳的道理。 你到了沈阳,如果从沈阳北出来,一定要走那条并行五车道,这并不是所有城市都有的大气。可越是往前走,道路就越狭窄,行不几里路,便已经看到了尽头。于是它干脆卸下了伪装,露出旧工业区的面貌。沿途一色的年代感十足俄式建筑,仿佛是它光荣的历史勋章。我想,沈阳也曾是辉煌过的。 我不甚喜欢沈阳的天气,它是怪脾气的!三月份和九月份大概是属于黄沙和扬尘的 2023-05-03 随笔 #生活
南湖钓叟 四月鳜鱼肥,钓叟不空回。久闻南湖钓叟众多,又值春深水暖,遂早起望观之。 四月的南湖吹着三月的凉风,五月的日头照耀着六旬的钓叟,倒也别有一番风味。辗转于钓叟之间,得趣事两则,遂成文记之。 其一 一钓叟满载将归,游于渔者之间, 遇钓而不得者,则曰:得鱼不易,垂钓良久,方得一篓。 遇钓而不多者,则曰:鱼之不多,食不果腹,吾当勉励之。 2023-04-16 随笔 #东北大学 #生活 #文言 #南湖公园
面试现场 面试现场 注: (1)为判断题目出现频率及题目难度,保留重复记录; (2)题目无解析; (3)部分题目记录来源公司、岗位; (4)只记录算法相关问题; (5)项目相关问题占比较大,但这类问题具有特殊性,只保留个别有关项目的典型问题; (6)不区分一、二面; (7)只记录技术面,不保留HR面; (8)有些问题已经忘记了,只记录了一小部分,因此以下问题不代表全部。 快手(数据挖掘算法工程师–日常实习) 2023-04-04 机器学习 #面试
Logistic回归 注:参考 https://zhuanlan.zhihu.com/p/74874291 1. Logistic 分布 Logistic 分布是一种连续型的概率分布,其分布函数和密度函数分别为: F(x)=P(X≤x)=11+e−(x−μ)/γF(x) = P(X \leq x) = \frac{1}{1+e^{-(x-\mu)/\gamma}}F(x)=P(X≤x)=1+e−(x−μ)/γ1 f( 2022-10-11 机器学习 #logistic #分类
朴素贝叶斯常见问题 1. 什么是朴素贝叶斯 朴素贝叶斯算法(Naive Bayes, NB) 是应用最为广泛的分类算法之一。它是基于贝叶斯定理和特征条件独立假设的分类器方法。由于朴素贝叶斯法基于贝叶斯公式计算得到,有着坚实的数学基础,以及稳定的分类效率。NB模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。以前的垃圾邮件分类都是基于朴素贝叶斯分类器识别的。 原理:朴素贝叶斯是基于贝叶斯定理与特征条件独立假设 2022-10-08 机器学习 #朴素贝叶斯 #后验概率
沈阳故宫-大帅府游记 沈阳秋天的雨,不疾不徐。它打湿着我的外衣,却无法熄灭我内心的火。 驱车(当然是单车)仅需半小时,也并非拒人于千里,更显得亲和力十足,这就是沈阳故宫–蕴含着清史的瑰宝。 从大清门到大政殿,再从大政殿到文溯阁……这便完成了一次观赏。陶俑、玉雕、诗词……透露着满清的风韵。若非涌动的人流,定会驻足多滞留片刻;若非关闭的窗壁,定要握在手上细细品玩。 张氏帅府,为中国抗战做出巨大贡献的张学良,肃穆沉重的 2022-10-01 随笔 #生活 #游记
搜广推业务常用简写释义 UGC(User Generated Content):用户生成内容,指的是由普通用户创建并分享的内容,例如社交媒体上的帖子、评论、图片等。 PGC(Professionally Generated Content):专业生成内容,指的是由专业人士或组织创建的内容,例如新闻、电影、音乐、书籍等。 PUGC(Professional User Generated Content):专业用户生成内容, 2022-09-05 技能 #简写
采样方法与集成策略 1 BootStrapping 采样 Bootstrapping 名字来自成语“pull up by your own bootstraps”,意思是依靠你自己的资源,称为自助法,它是一种有放回的抽样方法,是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。其核心思想和基本步骤如下: (1) 采用重抽样技术从原始样本中抽取一定数量的样本,此过程允许重复抽样。 (2) 根据抽出的样本计 2022-05-05 机器学习 #采样 #集成 #boosting #bagging
决策树 1 基础知识 1.1 熵 在物理学中表示一个系统的混乱程度,在信息论里面表示随机变量的不确定性的度量,熵越大,不确定性越大。 H(p)=−∑i=1npilog(pi)\begin{align*} H(p) = -\sum\limits_{i=1}^{n}p_{i}log ( p_{i} ) \end{align*} H(p)=−i=1∑npilog(pi) 显然0≤H(p)≤log(n)0 2022-05-04 机器学习 #决策树 #熵
常见分布函数及其性质 1、正态分布 1、数字特征 若 X∼N(μ,σ2)X\sim N(\mu,\sigma^{2})X∼N(μ,σ2),则 期望:$E(X) = \mu $; 方差:Var(X)=σ2Var(X) = \sigma^{2}Var(X)=σ2。 注:标准正态分布记为 X∼N(0,1)X \sim N(0,1)X∼N(0,1) 2、性质 每一个特定正态分布均可通过其均值μ、标准差σ来区分。他们分别确 2022-04-28 统计学 #分布函数 #期望 #方差