上海科技大学信息学院高盛华教授研究组招收博士后、研究助理、高级研究助理、研究助理教授。

  上海科技大学高盛华教授研究组招收博士后、研究助理高级研究助理、和研究助理教授。高盛华教授课题组从事世界顶尖计算机机视觉技术的研究,并致力于研究计算机视觉现实中的应用。本课题组同国际著名计算机视觉研究组有着深入的交流和合作。我们有大量发表世界顶级会议和期刊的机会,并提供充足的经费参加国内国际相关会议。我们提供非常具有竞争力的薪酬。具体要求如下:
  Qualifications for postdoc/research assistant professor:
    (1) Ph.D. degree in computer science or related areas.
    (2) Strong publication record in computer vision and machine learning.
    (3) Good communication skills and capability of supervising research students.
    (4) Fluent in oral and written English.

  研究助理和高级研究助理
    (1) 本科 (研究助理)/硕士(高级研究助理) 学位,计算机或者应用数学等相关专业,成绩优秀。
    (2) 具有良好的编程能力、分析问题能力和解决问题能力,对计算机视觉和机器学习等相关领域具有浓厚的兴趣
    (3) 具有良好的英文读写能力。

  有意者请将您的简历(如果是申请研究助理或者高级研究助理请附成绩单)发送至gaoshh@shanghaitech.edu.cn。邮件主题请注明您想要申请的职位。我们提供非常具有竞争力的薪酬。

  上海科技大学(ShanghaiTech University,简称上科大)是由上海市人民政府与中国科学院共同举办、共同建设的小规模、高水平、国际化的创新型大学。学校服务于创新驱动、转型发展的国家战略,致力于培养从事科学发现、高技术创新与新兴产业创业的拔尖人才。2013年9月,教育部批准正式建立上海科技大学;2013年9月,学校依托中科院上海分院各研究院所招收硕士研究生;2014年9月起开始招收本科生。
具体请参看:http://www.shanghaitech.edu.cn/intro.asp

高盛华老师publications请参考:http://sist.shanghaitech.edu.cn/faculty/gaosh/Publications.html
高盛华老师简介请参考:http://sist.shanghaitech.edu.cn/cn/StaffDetail.asp?id=67

DeepFace:Closing the Gap to Human-Level Performance in Face Verification

Deep Learning Face Representation from Predicting 10,000 Classes

  实际上作者就是利用每张人脸的图片,去做成60个patches,每个patch训练一个models,最后一层是softmax。然后用训练得到的模型提取features,将60个CNN models提取到的features组成一个vector,最后用来训练用于验证的神经网络。

马毅教授科研经验语录:

关于如何与学术界人交流与沟通:

  把你的问题formulate清楚。经常有人问我要稀疏字典的code,发个邮件过来说:“诶,马老师,你的某篇论文我有点不太清楚,能不能把code发给我?”
  “你连问题都没问清楚,我凭什么把我的code给你。”
  在你提出问题的时候,要把你付出的努力,你做过什么说清楚。让人家看到你哪里努力了,让人家看到你都做了些什么,这样人家才清楚把他的代码share给你有没有意义。所以你们以后发邮件问作者的时候,一定要把你做过的东西说清楚,把你的问题定义清楚,这样人家才乐意去回复你。

关于组会准备工作:

  以后每次工作都要准备好你的slides,不要等我问到你们的时候,什么都回答不上来。等到我什么都不问你了,也就不会care你了。所以要主动去问,遇到公式推不懂,把问题formulate清楚了告诉我。我会帮你解决的。

名言集锦

  1 Now, you can afford to fail
  2 消除对新知识的恐惧,培养上进心、
  3 research starts with search
  4 idea is cheap
  5 数学证明不能像散文一样,要严谨
  6 要做就做吸引人眼球的东西
  7 【自己心得:不要取悦别人,而是应该取悦自己】
  8 做一件事情,你不花功夫时间把事情做好就是浪费时间
  9 时间来自于哪里,时间来自于motivation

本文主要解释一些深度学习模型work的原理

CNN模型训练人脸分类效果为什么会好?

  一幅图像中,各种复杂的因素往往以非线性的方式结合在一起。例如人脸图像中就包含了身份、姿态、年龄、表情和光线等各种信息。深度学习的关键就是通过多层非线性映射将这些因素成功的分开,例如在深度模型的最后一个隐含层,不同的神经元代表了不同的因素。如果将这个隐含层当作特征表示,人脸识别、姿态估计、表情识别、年龄估计就会变得非常简单,因为各个因素之间变成了简单的线性关系,不再彼此干扰。

CNN学习针对人脸图像的分层特征表达:

  它可以学习针对人脸图像的分层特征表达。最底层可以从原始像素学习滤波器,刻画局部的边缘和纹理特征;通过对各种边缘滤波器进行组合,中层滤波器可以描述不同类型的人脸器官;最高层描述的是整个人脸的全局特征。

深度学习模型提取全局特征和上下文信息的能力:

  事实上即使存在局部遮挡的情况下,人眼也可以根据脸部其它区域的信息估计被遮挡处的标注。这意味着全局和上下文的信息对于局部的判断是非常重要的,而这些信息在基于局部特征的方法中从最开始阶段就丢失了。理想的情况下,模型应该将整幅图像作为输入,直接预测整幅分割图。图像分割可以被当作一个高维数据转换的问题来解决。这样不但利用到了上下文信息,模型在高维数据转换过程中也隐式地加入了形状先验。但是由于整幅图像内容过于复杂,浅层模型很难有效地捕捉全局特征。
  之所以CNN模型能够学习到全局特征,是因为在每个卷积层和pooling层操作的时候,都是多个pixels转换成一个pixel的过程,这样的话,生成的pixel就可以更好地表征转换前的pixels的特征。即使存在occlusion,CNN也会在最后一层学到occlusion周围信息的features。

很多应用的训练集是较小的,如何在这种情况下应用深度学习呢?

  可以将ImageNet 上训练得到的模型做为起点,利用目标训练集和反向传播对其进行继续训练,将模型适应到特定的应用[10]。ImageNet 起到预训练的作用。
  如果目标训练集不够大,也可以将低层的网络参数固定,沿用ImageNet 上的训练集结果,只对上层进行更新。这是因为底层的网络参数是最难更新的,而从ImageNet 学习得到的底层滤波器往往描述了各种不同的局部边缘和纹理信息,而这些滤波器对一般的图像有较好的普适性。
  直接采用ImageNet 上训练得到的模型,把最高的隐含层的输出作为特征表达,代替常用的手工设计的特征[19][20]。

Caffe学习总结Slides下载地址

阅读流程

  自己总结的caffe使用教程,总结了国内大部分博客关于caffe讲解的地址,并且给出了很多不同操作的流程。适合和我一样的菜鸟学习caffe。现在抽取几页slides给大家大概知道slides讲什么内容:







Clustering Algorithm

这篇博文解决了马毅老师《GPCA》新书中第四章的下面的问题:

我把实现如下算法的几个都放在了自己的github主页:代码链接下载地址
函数解释文档解释文档链接地址

Laplacian Eigenmaps (LE)

  LE算法的思路就是局部点之间的距离保持不变,进而使投影之后的结果也是保举的,和LPP的思路类似。其优化目标如下:

  而对于W公式的构造有三种方法:
    K-NN affinity:对于N*N的W矩阵,设置某个点i与其他所有的N个点中距离最小的K个点$W_{ij}$设置为1,其余点设置为0;
    Gaussian affinity: $w_{ij}=exp(-||x_i-x_j||_2^2/2\theta ^2)$,并且$\theta$通常设置为1.0;
    $\epsilon$-neighborhood:就是将距离小于$\epsilon$的$W_{ij}$设置为1,其余的设置为0;

  我们如何分析这个优化问题呢?可以通过以下变形得知:

  即最小化问题变成(约束条件由马毅老师的handnotes可知):

  将优化问题改写成为拉格朗日函数:

  经过求解可知,$YL=\Lambda YD$,进而推出$YLY^T=\Lambda YDY^T=\Lambda$,所以最优化的解变为$trace(YLY^T)=trace(\Lambda)$。这就是为什么算法流程图里面是求(L,D)的最小的d个特征值对应的特征向量。

算法流程图:

K-means Clustering

  K-means算法的思路就是通过最小化所有数据点到离他最近的聚类中心的距离之和,并通过这个来估计聚类中心,并进行聚类。其优化目标如下:

  其中,当数据点j的最近的聚类中心点i时,$W_{ij}=1$,其他的为0。$u_i$为聚类中心。

算法流程图:

Spectral Clustering

  谱聚类的算法实际上就是基于图论的聚类方法,学习一个合适的非线性的映射,使得映射后的数据点可用k-means进行更好的分类。

  对于每一个connected graph,我们都可以写出一个如下的表达式,这也是使得这n个graph聚类的思路。因此我们要找到n个使得$LX=0X$的特征向量。但是实际中,需要找到n个最小的特征值对应的特征向量。

算法流程图:

MinCut问题:

  实际上,n个connected graphs之间,也有极其小的连接,因此我们还需要度量不同subgraph之间的连接。优化目标如下:

  因此,优化目标可以改写成:

RatioCue问题:

  但是我们会发现这样的优化目标最后会导致每一个数据点成了一个subgraph,因此我们需要加一个约束项使得这种情况不会发生。


  其中:


  因此最终的优化问题又变成了:

Normalized Cut & Normalized Spectral Clustering

  用拉格朗日解最后的方程得到$Lf=\lambda Df$,这是一个广义特征值问题,因此我们求这个表达式最小的n个广义特征值对应的广义特征向量。这是NCut问题的解法。
  另一种解法是令$T=D^{1/2}F$,因此优化问题变成了解以下目标函数:

  即求$D^{-1/2}LD^{-1/2}$的最小的n个特征值对应的特征向量问题。

算法流程图:

Normalized Cut:

Normalized Spectral Clustering:

hexo教程

hexo new page “about” 新建一个about导航
INFO Created: c:\Learning Files\github\tangxu\source\contact\index.md

hexo new post “mingzi” 新建一个mingzi的post来发表文章
INFO Created: c:\Learning Files\github\tangxu\source_posts\post.md

![] ( 图片链接地址 ) 在markdown中插入图片信息

&emsp ; & emsp;表示首行缩进两个格子

hexo d -g #生成加部署
hexo s -g #预览加部署

github如何上传自己的代码:

…or create a new repository on the command line

echo # - >> README.md
git init
git add README.md
git commit -m “first commit”
%—————此步需要手动在github创建新的repository,比如clustering————-%
git remote add origin https://github.com/takecareofbigboss/clustering.git
git push -u origin master
…or push an existing repository from the command line

git remote add origin https://github.com/takecareofbigboss/clustering.git
git push -u origin master
…or import code from another repository

You can initialize this repository with code from a Subversion, Mercurial, or TFS project.

每次需要提交代码的文件,就用以下操作:
git add k_means.m
git add main.m
git commit -m “first commit”
git push -u origin master

latex 模板

\documentclass{article}
\usepackage{amssymb}
\usepackage{mathrsfs}
\usepackage{ctex} %用于插入中文字符
\usepackage{float}
\usepackage[version=3]{mhchem} % Package for chemical equation typesetting
\usepackage{siunitx} % Provides the \SI{}{} and \si{} command for typesetting SI units
\usepackage[colorlinks,linkcolor=red,anchorcolor=blue,citecolor=green]{hyperref}
\usepackage{graphicx} % Required for the inclusion of images
\usepackage{natbib} % Required to change bibliography style to APA
\usepackage{amsmath} % Required for some math elements
\usepackage{indentfirst}

\setlength\parindent{2em} % Removes all indentation from paragraphs

\renewcommand{\labelenumi}{\alph{enumi}.} % Make numbering in the enumerate environment by letter rather than number (e.g. section 6)

%\usepackage{times} % Uncomment to use the Times New Roman font

%————————————————————————————————————————————
% DOCUMENT INFORMATION
%————————————————————————————————————————————

\title{Weekly Report} % Title

\author{Xu Tang} % Author name

\date{\today} % Date for the report

\begin{document}

\maketitle % Insert the title, author and date

你好

\end{document}