YangLong's Blog

累了就睡觉,醒了就微笑

基于Tensorflow的问答系统

Question answer with tensorflow

Question answer with tensorflow QA 系统用于回答自然语言提出的问题,QA系统从文本和图像提取信息后去回答问题,这种系统主要被分成两块:open domain回答的答案不限定于某个领域,close domain回答的问题限定于某个领域如医学、网点常用服务内容。 本文主要使用动态记忆伸进网络作为QA的算法,主要使用Tensorflow作为开发的框架。 环境...

CNN网络进行文本分类

Text Classfication with CNN

翻译中….

Gensim的应用

Gensim的介绍和应用

Gensim的应用 Why use Gensim? Scalable statistical semantics 可伸缩的统计语法 Analyze plain-text documents for semantic structure 纯文本的分析语法结构 Retrieve semantically similar documents 检索相似语义文档 Example 语...

潜在语义分析

Latent semantic analysis

LSA Latent semantic analysis 潜在语义分析 其核心思想是把我们所拥有的文档-术语矩阵分解成相互独立的文档-主题矩阵和主题-术语矩阵,其主要方法是使用SVD奇异值分解来进行 #### Step.1 生成文档-术语模型 如果在词汇表中给出 m 个文档和 n 个单词,我们可以构造一个 m×n 的矩阵 A,其中每行代表一个文档,每列代表一个单词。在 LSA 的最简...

主题生成模型

Latent Dirichlet Allocation

LDA(Latent Dirichlet Allocation) 主题模型 Refrence Parameter estimation for text analysis https://users.soe.ucsc.edu/~amichelo/docs/text-est2.pdf Wikipedia https://en.wikipedia.org/wiki/Latent_Di...

词向量

Word Embdding & Gram

Word Embdding & Gram 词向量&Gram模型 Word Eembdding 词向量 NPLM(Neural Probablistic Language Model)神经概率语言模型 语言模型 词串是${w_t}_{t=1}^T=w_1^T=w_1,w_2,…,w_T$自然语言的概率$P(w_1^T)$ $w_t$下标 t 表示其是词串中的第 t ...

距离计算

Manhattan Distance & Minkowski Distance & Minkowski Distance

Manhattan Distance 曼哈顿距离 曼哈顿距离又称计程车几何距离或方格线距离,是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,为欧几里得几何度量空间的几何学之用语,用以标明两个点上在标准坐标系上的绝对轴距之总和。曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是在欧几里得空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。例如在平面上,坐标(x1,y1)的点P1与坐...

自动解码

AutoEncoder

Summary 自动编码器基于这样一个事实:原始input(设为x)经过加权(W、b)、映射(Sigmoid)之后得到y,再对y反向加权映射回来成为z 通过反复迭代训练两组(W、b),使得误差函数最小,即尽可能保证z近似于x,即完美重构了x。 那么可以说正向第一组权(W、b)是成功的,很好的学习了input中的关键特征,不然也不会重构得如此完美 The autoencode...

聚类算法

K-Means

K-Means 硬聚类算法 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 计算步骤: 从N个文档随机选取K个文档作为质心 对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类 新计算已经得到的各个类的质心 ...

决策树

Decision Tree

Decision Tree 决策树 Refrence https://blog.csdn.net/huanghui147258369/article/details/53689068 http://ml.apachecn.org/mlia/design-tree/ Theory 分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有...