Pallashadow的个人资料

发现NLP领域一个很有价值的课题 Quotation speaker identification 就是把小说里每个角色说的话打上姓名标签这样就能自动整理出无数的多轮对话语料，可以做固定风格聊天机器人用，而且还是非常值钱的多轮对话查了一下有最近两篇文章 1、Whose Line Is It? – Quote Attribution through Recurrent Neural Networks 好像是stanford cs224d课件？2016年 2、Identification of Speakers in Novels， 2013 报告结果都很一般

现在整天重复造轮子，想研究点有建设性的东西

paper 用野数据做语音合成 Voice Synthesis for in-the-Wild Speakers via a Phonological Loop

bilibili台大林轩田老师的《机器学习基石》 @爱可可-爱生活: 为方便大家学习，在#bilibili#上搬运了台大林轩田老师的《机器学习基石》O网页链接和《机器学习技法》O网页链接两门MOOCs，暑期学习愉快~ http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.bilibili.com%2Fvideo%2Fav12463015%2F&urlrefer=6dcd46f4569a3c387490abf61efe8027

paper 无监督人脸身份聚类虽然我们的单模型在lfw 99.4%，在megaface上71%，但在百万级别的门禁场景下面对各种遮挡光照侧脸模糊眼镜化妆仍然十分捉急。我们的机器人有机会在真实的人机交互场景抓取大量人脸数据，我们希望通过算法自动为海量人脸图片进行标注，以此廉价地获得大量数据集。商汤科技（sensetime）和港中文5天前arxiv了一篇论文，用反强化学习（Inverse Reinforcement Learning）解决这件事，声称效果非常好的样子 merge or not? Learning to group faces via imitation learning http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Farxiv.org%2Fabs%2F1707.03986&urlrefer=94cdf8b773f14aa96a74f1f53d302f45

[paper] Dynamic Memory Network

[精]各版本深度学习框架性能对比

是否可能用有性生殖的思路改善迁移学习

WaveNet: A Generative Model for Raw Audio

betaVAE 和infoGAN

推荐微信公众号createAMind

Graph SLAM学习笔记挖个坑

Open-sourcing DeepMind Lab

MSRA放出coco2016冠军图像语义分割论文

[paper] 视觉信息与词向量信息结合做zero-shot learning

论文 deep reinforcement learning for dialogue generation

google project tango资料不完全汇总

如何识别人类涂鸦？ http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fcybertron.cg.tu-berlin.de%2Feitz%2Fpdf%2F2012_siggraph_classifysketch.pdf&urlrefer=beeddb988a00bc4d85bb055f77f90615 可以从ImageNet自建训练集吗?

tensorflow 怎么指定单显卡？

手绘人像模拟真人表情 1、画中头像面部68点2D标记T，及对应的Delaunay三角模型Dt 2、个人面部50点3D标准模型C 3、个人面部68点2D标准模型S，及对应的Delaunay三角模型Ds 4、对现实中的每个2D 68点st，人脸旋转矩阵R, 推算3D 68点模型ct，并用ct*R投影得到正脸st’ 5、计算st’在Ds上的位置，并对应到Dt上得到tt 6、用st’融合+对称约束优化S，并更新Ds 7、将T变形映射到tt

关于nvidia tegra k1 嵌入式gpu的问题我想用一个android开发板直接调用tk1的GPU，把开发板的其他部分丢掉可行吗？

[paper] 关于意识为什么和量子力学效应无关的问题我在看Max Tegmark的这篇文章，求讨论 The Importance of Quantum Decoherence in Brain Processes http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Farxiv.org%2Fpdf%2Fquant-ph%2F9907009v2.pdf&urlrefer=af45f6636df364683f114ce70286a6b0

DL框架如mxnet，加载模型速度慢10倍可能是opencv3的配置问题解决方案 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fanswers.opencv.org%2Fquestion%2F5090%2Fwhy-opencv-building-is-so-slow-with-cuda%2F&urlrefer=56f99a567b179f0d24161b7bb1765704 将cmake的时候cmake-gui ..选项下将CUDA_ARCH_BIN改为对应GPU的Compute Capability 查找GPU参数：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fdeveloper.nvidia.com%2Fcuda-gpus&urlrefer=c5b94995eb57e08dd6037833a9869fa4 改了以后加载速度可能提升10倍以上

物体追踪中的提前量规划问题人脸追踪的提前量规划问题目标，让机器人的视线一直盯着人脸视人脸位置为一个2D图像坐标上的一个点，坐标为x0,y0 人脸移动速度为vx,vy 令机器人注视点为x1,y1，（可视为图像中心点）假设图像没有鱼眼畸变，机器人头部舵机最大角加速度可换算到2D平面的线加速度，令此加速度为a 求坐标x,y，使机器人注视点向此点移动后正好能与人脸位置重叠，且耗费的时间t最短有如下公式： (x0-x1+v_x t)^2 + (y0-y1+v_y t)^2 = a^2 t^4 / 16 t>0 取最小t ` x = x0+v_x t ` y = y0+v_y t

[脑洞]自动身份聚类现在机器人上有一个CNN，能把任意身份人脸映射到128维球面的一个点上，且相同身份的脸之间的cos距离一般大于0.7。可以按次规则做身份识别。分类的思路：传统身份识别的流程是先录入一些图片，并标记身份。相当于在128维球面上标记了一些有身份的点。这些点一般分布在cos距离大于0.7的局部球面上。之后新的人脸图片按照最近邻（如KNN）方法分类。 ———————————————————————————————————— 现在讨论聚类的思路 1、把所有见过的人脸都记录到128维球面上 2、每个点都初始化为一个id，其centroid（中心点）为自己的位置 3、重心法聚类：对于任意id的centroid，如果其距离0。7以内的球面上存在另一个id的centroid，则合并两个id，并重新计算centroid; 直到所有id无法继续合并 4、如果id数量过多，则删掉id内样本数量少的id 5、对于每个id，定期删除距离centroid 0。6 以外的点身份录入过程：机器人询问人名时人名与聚类后id绑定

北京地区招机器视觉实习生，简历砸我本科大四或研究生对人脸物体人体手势文字-检测追踪识别，点云处理，导航定位SLAM感兴趣的北京，上地地区

Acoustic Modeling in Statistical Parametric Speech Synthesis Acoustic Modeling in Statistical Parametric Speech Synthesis - From HMM to LSTM-RNN http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Farxiv.org%2Fpdf%2F1602.06727.pdf&urlrefer=e69e6e6465e7a8ca7f50baace3f90021

请问市面上的letv xtion pro的驱动是重写过的吗？为什么OPENNI2找不到设备？

ORB-SLAM2玩耍笔记 ORB-SLAM2 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgithub.com%2Fraulmur%2FORB_SLAM2&urlrefer=b06bcb6b106945e5c484d3b497bfebcb 是一个西班牙帅哥弄的 Raul Mur-Artal

关于图像清晰度检测的问题如果对所有尺寸的图片都拉普拉斯变换，然后求方差，会得出距离越远的图片越清晰的荒谬结论而如果把所有尺寸的图片都缩放到同样的尺寸再处理，计算成本又太高，有什么计算复杂度更低的方法吗？

tensorflow playground没玩过的快来玩地址：http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fplayground.tensorflow.org%2F&urlrefer=cf6462b92234edeb45f3ad53126cd7ac

SSD好强，看上去faster-rcnn已经过时了 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.cs.unc.edu%2F~wliu%2Fpapers%2Fssd.pdf&urlrefer=a6d10cfb50ed484cb13467003b9d45bf

今年GPU再买泰坦合适吗？深度学习用，单精度，所以不用tesla

用android做机器人，长期来看会有什么问题？

一种用CNN画地图，再定位导航的方法？比如先识别一些关键物体或图案的位置，以物体为单位画地图，再根据地图+粒子滤波之类的东西定位，是不是比slam节省资源得多？

cvpr2014 极速人脸特征点检测 20行代码应用范例： http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fblog.dlib.net%2F2014%2F08%2Freal-time-face-pose-estimation.html&urlrefer=45bfb3f1ed1d1eff539adf606ecba93e 论文： http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.cv-foundation.org%2Fopenaccess%2Fcontent_cvpr_2014%2Fpapers%2FKazemi_One_Millisecond_Face_2014_CVPR_paper.pdf&urlrefer=fdb5af8eef0993f3122fd678ad6cc2b6 继承论文： http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fresearch.microsoft.com%2Fen-us%2Fum%2Fpeople%2Fjiansun%2Fpapers%2Fcvpr12_facealignregression.pdf&urlrefer=4d59fbd92010e79b2d2a189c2a3efdc6

高维空间球面的均匀分布怎么弄？

caffe batch forward 显卡内存不满？ 4G显存只用了700M为什么？命令行用 nvidia-smi -l 1 看的

[deepmind] 不完全信息游戏解法论文：http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2F120.52.73.75%2Farxiv.org%2Fpdf%2F1603.01121v1.pdf&urlrefer=dfbbbdcd88735034d732f3c3939be61e MIT techrev: http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.theguardian.com%2Ftechnology%2F2016%2Fmar%2F30%2Fdeepmind-poker-alphago-computer-casino&urlrefer=fe133e10c163c4ad2be829d85352d2a6

找到的超详细caffe博客 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.cnblogs.com%2Fdenny402%2Ftag%2Fcaffe%2Fdefault.html%3Fpage%3D2&urlrefer=807e9e44702cba934c6c8bde0c0dc8b3

2类softmax和逻辑回归有什么区别？突然很好奇

现在可见光做手势识别一般能支持多少种手势？识别率多少？

想收集人类的表情，100万张左右，怎么办？ 10万张也行啊

卷积神经网络前馈速度问题只用CPU, 一个300M参数的VGG_S网络运行需要0。5秒而一个40M参数的LeNet需要1秒什么原理？

李世石居然赢了一局

AI如何玩星际首先要干死黄旭东

总结一下Google AlphaGo的技术脉络 AlphaGo所用到的技术有三个来源，可以认为是三条主线 1、搜索算法（Monte Carlo Tree Search） Herbert Simon, Allen Newell (1958) Elements of a theory of human problem solving. Bruce Abramson 1987年PHD论文, MC与TS结合 Brügmann, Bernd (1993).首次用于围棋 Rémi Coulom (2007). 首次将此算法命名为Monte Carlo Tree Search L. Kocsis and Cs. Szepesvári 2008 发展为UCT算法 2、图像识别 Frank Rosenblatt 1957 感知机 Hubel, D. H.; Wiesel, T. N. (1968). 对猴子视觉皮质的研究 Paul Werbos, David E. Rumelhart, Geoffrey E. Hinton and Ronald J. Williams (1986) BP神经网络 Yan LeCun(1998) LeNet，现代CNN雏形 Geoffrey E. Hinton (2006) 深度学习概念提出 Christopher Clark，Amos Storkey （2014）用CNN下围棋，纯从当前盘面预测高手会走哪里，与纯UCT算法互有胜负，这时局面已经开始失控，相关讨论参考 http://tieba.baidu.com/p/3470261853 3、强化学习 B. F. Skinner(1938) 《有机体的行为》提出操作性条件反射的概念 Schultz (1997) 人类多巴胺系统的的actor-critic强化学习模型 Sutton & Barto (1998) 强化学习经典教材出版 DeepMind（2013）CNN+用BP算法模仿Q-learning，提出Deep Q-learning算法，强化学习玩电子游戏超过人类水平，相关讨论参考 http://tieba.baidu.com/p/3457898104 DeepMind（2014）利用actor-critic构架改进DQN算法，提出deterministic policy gradient算法，将policy-network与value-network分离，相关讨论：http://tieba.baidu.com/p/4052826748

google deep learning 公开课 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.bilibili.com%2Fvideo%2Fav4055334%2F&urlrefer=29ff900a877af012a39291bbe9539401

怎样简单地判断人脸朝向？我看到有个人用dlib和opencv的solvePnP函数来判断，似乎很有意思，还有更简便的方法吗？ http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgithub.com%2Fchili-epfl%2Fattention-tracker&urlrefer=5dfe7a0781d7e701e87294d02d4b5eec

[转]汤晓鸥：百度并没有“作弊” 吴韧工作令人钦佩 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fsports.sina.com.cn%2Fgo%2F2016-03-07%2Fdoc-ifxqaffy3713240.shtml&urlrefer=d082ec4ca32864323edf26573e4912c6

要写本书对人脑的常见误解与偏见 -人类智力是神秘的超自然现象？ -智力是创造的，无法超越与改进的？ -人脑只被利用了10%？ -语言是思维的核心？ -人脑的运算能力不如超级电脑，甚至不如家用PC？ -意识是人类智力的核心？ -意识是行为的原因？ -人脑中存在中央控制系统？人脑 -神经科学的研究方法 -人脑解剖与功能概述 -神经元-一种机械装置 -感觉，视听嗅肤味及其本质 -知觉，信号处理与概念的形成 -抽象概念 -记忆与推理 -基底神经节 -人脑的计算能力究竟是多少生物智能的起源与内在逻辑 -演化论的逻辑，智能体动机的来源 -世界与智能体 -丹尼特塔与智能4等级 -第一阶段：有限状态机，抽象，概念的生成 -第二阶段：行为选择与强化学习 -第三阶段：世界模型与预测系统 -第四阶段：镜像系统，模仿，技能的跨个体传输人工智能及其历史，从图灵到1990 -从图灵到冯 -信息论 -智能体-描述智能的统一框架 -符号主义模型，ACTR，SOAR -搜索算法 -大低谷机器学习的崛起，1990到2016 -概率论 -有监督学习 -无监督学习 -强化学习 -连结主义模型，CAP2，SPAUN 关于一切智能的统一的理论 -机器学习与人脑的关系 -记忆，推理，感知，识别，计算 -降维 -卡尔曼剃刀 -分布式表征与深度学习 -深度学习能否解决一切问题？对语言的重新阐述 -语言的进化论起源 -词向量 -作为复制因子的语言 -寄生物与宿主意识的本质与制作方法 -实验证据 -世界的数据结构 -最伟大的艺术创造力与遗传算法的普遍性 -创造不是结果而是原因 -普适达尔文主义 -作为复制因子的代码 -无尽的轮回人工智能的未来 -摩尔定律 -大数据 -知识共享 -情感机器 -脑机结合的困难反思 -对进化论的反思 -对神秘主义的反思 -伦理学 -地球文明的未来

人脸情绪识别备忘录开源数据 1. Cohn-Kanade AU Coded Facial Expression Database http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.pitt.edu%2F~emotion%2Fck-spread.htm&urlrefer=b1c10f3c0caef9755cdffd5065778838 2. Japanese Female Facial Expression (JAFFE) Database http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.kasrl.org%2Fjaffe.html&urlrefer=6f60fc6af86c7fe01391b7dfb51a4ced 3. Karolinska Directed Emotional Faces (KDEF) http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.emotionlab.se%2Fresources%2Fkdef&urlrefer=e8af49668bf041bb704738912ea74114 4. Radboud face database http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.socsci.ru.nl%3A8180%2FRaFD2%2FRaFD%3Fp%3Dmain&urlrefer=985ddb6dba57772b2d4c639273c7846d API demo http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.kairos.com%2Femotion-analysis-api&urlrefer=f3c737f45aee5f274a6bf5bdc91dab98 CNN论文和代码 2015年 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.openu.ac.il%2Fhome%2Fhassner%2Fprojects%2Fcnn_emotions%2F&urlrefer=bcfb7055f4fd4c58869fa75c6abd5077

情感模型综述2011 引用100+的一篇 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.364.5223%26rep%3Drep1%26type%3Dpdf&urlrefer=bbf4205e7720c173e29c089b3fbee17e

[水] 征集两道只有人工智能相关人员才能答出来的题并且百度上搜不到答案

我在看Autobahn的文档 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fautobahn.ws%2Fpython%2Findex.html&urlrefer=e8415e42a81f647c51c3723e68b53434 Open-source (MIT) real-time framework for Web, Mobile & Internet of Things.

[转] 后 ImageNet 时代：李飞飞视觉基因组重磅计划，新一轮竞赛 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fchuansong.me%2Fn%2F2540449&urlrefer=688c6289d0b5edf09f93053ed85d59dd