喵的程序園

OpenGL 閱讀筆記 (二) OpenGL基本操作

這邊虎喵跳過glfw/glew的初始化,
先來提一下OpenGL的基本操作方式

前面也提到過, OpenGL是一個類C的語言,
因此使用C/C++的攻城獅們應該會感到很熟悉.
OpenGL的基本動作循環如下:

每一行code的解釋如下:

// 本地變數, 用來獲取操作物件的索引值(index)
int object;

// 向OpenGL獲取對應的index, 數量numbers可以自己指定, 需要跟你傳進來的object指針匹配 
// 由於此時帶進來的object只有一個int, 因此這邊number會填1
glGenXXXObject(OBJECT_NUMBERS, &object);

// 綁定該index到操作物件上, 操作物件的類型都是OpenGL定義好的, 需要依照使用來選擇
glBindBXXXObject(SOME_OPENGL_DEFINED_TARGET, object);

// 將資料傳送對應的操作物件上面
glBufferData(SOME_OPENGL_DEFINED_TARGET, sizeof(YOUR_DATA), YOUR_DATA, object);

// 解綁操作物件
glBindBXXXObject(SOME_OPENGL_DEFINED_TARGET, 0);

// 釋放操作物件
glDeleteXXXOject(OBJECT_NUMBERS, &object);

從上述的流程我們也可以看出:
真正負責管理物件的人是OpenGL
我們從CPU端可以做的事情是向OpenGL索取操作物件的index,
在CPU操作的時候都需要透過這個index來進行.

有了這個基本概念以後,
我們接著開始介紹繪製圖形必要的兩個著色器 (Shader)
只要使用這兩個著色器就可以畫出圖形了~

OpenGL 閱讀筆記 (一) 基礎工作環境

最近虎喵要開始學習OpenGL啦~
做為自己的閱讀筆記與心得, 希望也能幫助到各位

1. OpenGL是幹啥用的?

OpenGL = Open Graphics Library
顧名思義, 是開放圖形函式庫
主要的功能是用來繪製2D/3D向量圖形
OpenGL是一個規範, 定義了對應的API要有的行為, 與平台/開發語言沒有相關性.

儘管OpenGL的實作可以完全依靠軟體實現, 但它其實是為了硬體加速而設計的,
跟平台相關的細節將由不同的作業系統進行實現,
而OpenGL的硬體加速支援則是由顯卡廠商負責實現.

OpenGL的定義方式類似於C語言, 但他是語言獨立的,
因此你可以看到不同的開發語言上都對於OpenGL的使用進行了封裝.
(例如你可以在開發Android Apps使用Java的GLES20類別來呼叫OpenGL)

2. GLEW 與 GLFW

聽從丁小喵的建議, 我的開發環境是使用Ubuntu 14.04, 搭配的IDE是Eclipse

如果要直接使用OpenGL的函式庫的話, 必須要先抽取出相關函式,
像是這樣:

const char *name = "glGenBuffers";
void *p = (void *)wglGetProcAddress(name);
if (p == 0 ||
   (p == (void*)0x1) || (p == (void*)0x2) ||
   (p == (void*)0x3) || (p == (void*)-1)) {
 HMODULE module = LoadLibraryA("opengl32.dll");
 p = (void *)GetProcAddress(module, name);
}

如果每個Function都要這樣幹一次就太疲勞了,
GLEW (OpenGL Extension Wrangler Library) 已經幫你幹好這件事情啦
只要編譯的時候連結到glew的函式庫, 加上對應的header就可以無痛使用

再來是剛剛提到的平台無關的特性, 這點就交給GLFW完成囉!
可以到GLFW的官網下載對應OS的函式庫, 當然他也有提供Source code可以自行編譯.
設置好這兩個函式庫之後就可以開發啦, 這時候你的.cpp內會有

// GLEW (Warp the GL library, you don't need to retrieve function by yourself)
#define GLEW_STATIC
#include <GL/glew.h>
// GLFW (Setup the window which support OpenGL operation on different platform)
#include <GLFW/glfw3.h>

這樣就完成最基礎的開發環境設置囉!

[OPENCV] FaceDectection - (四) 模型訓練

前面幾篇關於FaceDetection的文章已經介紹如何應用openCV內建的 library

以及分析臉部辨識所需要的xml檔案

這一篇文章將會介紹如何產生出 xml 檔案提供給 openCV使用

獲取人臉資料庫

因為要重新訓練出模型, 因此需要有大量的人臉圖案

喵使用了FERET的資料庫

[OPENCV] FaceDectection - (三) 實務剖析

HaarCascade Xml

在一開始 [OPENCV] FaceDetection - (一) 初步探索

的程式碼當中, 最主要的參數是去讀取 haarcascade_frontalface_alt.xml

int main(int argc, char** argv) {

  // Load preconstructed classifier
  face_cascade.load("data/haarcascade_frontalface_alt.xml");
  Mat inputImage = imread(argv[1]);
  detectFaces(inputImage);
  waitKey(0);
  return 0;
}

這邊開始, 喵要詳細的解構這xml檔案
一開始的對於整個cascade的參數

<opencv_storage>

<cascade type_id="opencv-cascade-classifier"><stageType>BOOST</stageType>

FeatureType: HAAR / LBP / HOG
Height: Mask 高度
Widht: Mask 寬度
stageParams --> maxWeakCount: 最多有幾個weak nodes in a classifier
maxCatCount: 最多串幾個 nodes (設定為0, 代表沒有使用串接)
stageNum: 共有多少個 Stage

[ML] Back propagation 推導

我們來推導一下 Back propagtion 的公式,

首先先設想一個只有兩層的 Neural network 如下:

從上圖我們先列出公式如下:

Z = a * W'

hx = sigmoid( Z )

由前面的經驗我們可以得到,

當我們要對 W 進行更新來最小化分類誤差時, 使用 Gradient descent 來更新 W.

那麼如何求出 W 的 Gradient 呢?

我們可以把這個式子使用連鎖律展開!

第一個跟你的Cost function直接相關的是 output layer (a)

而 a 又是經過 sigmoid (z) 得到的

那 z 就可以跟Wij扯上關係啦!

這樣就可以把式子展開如下:

第一層的微分項, 也就是你的 Cost function 對 prediction value 微分, 可以得到 (y - a)

第二層的微分項, 可以得到 a * (1-a)

第三層的微分項則是可以得到再上一層的output layer a

那麼如果再看到上一層的 Wij 呢?

我們看到回到上述第三層的 partial z 部分, 我們知道它是由前一層的 a * Wij 來的,

所以我們在這邊使用連鎖律再把它展開, 可以得到下面的式子

依此類推就可以得到每一層權重 W 的 gradient 項了~