2016年9月16日 星期五

最佳化繪圖管線批次繪製物件(Batch Sprite)

最開始的時候,good的繪圖管線為了簡化設計和實作,物件在繪製時是一個一個畫。每個物件都是以一個glDrawArray畫出來,也就是說花費一個draw call畫出來。

一開始針對繪圖最佳化的規劃除了貼圖合併之外,另一個主要的功能是批次繪製功能作最佳化。現在終於實作了這個功能,可以大幅減少draw calls。

原來繪製物件的方式是透過glVertexPointer傳入長寬各為1的單位矩形,再使用glDrawArray畫出物件。底下是簡單的記錄,一步步將原本的繪製物件的管線轉換為批次繪圖方式。

1,第一步就是先把glTranslate、glScale及glRotate等方法替換掉。首先弄個可以計算4*4矩陣的工具,把這些方法都透過矩陣運算,得到一個轉換矩陣。再使用glLoadMatrix載入這個自行計算得到的轉換矩陣,然後看看是不是結果和原來一樣,如果和原來的結果是一樣的話,表示這個轉換矩陣的計算是正確的。

使用glLoadMatrix載入轉換矩陣時,如果結果不對,可以試試對轉換矩陣作一次transpose轉換,看是不是因為使用的矩陣定義和OpenGL相反。

2,第二步要利用上面求出且驗證正確的轉換矩陣,來再進一步替換掉glLoadMatrix。也就是將傳入glVertexPointer的矩形的4個點,用轉換矩陣轉換成最終結果的座標,並且不需要使用glLoadMatrix將轉換矩陣傳遞給OpenGL,因為我們已經自己作了座標的轉換。再來驗證看看結果是否正確,沒有問的話就可以進入到下一步。

3,以上兩個步驟已經將OpendGL轉換矩陣的部份都替換掉,由我們自已的底層計算得到。將來再作進一步最佳化時,還可以把這個預先計算得到的轉換矩陣cache起來,只在狀態變動及需要時再重新計算,如此還可以進一步提高繪圖速度。

接下來就是要將每一個繪製物件的動作儘可能的合併起來批次處理。基本原則是準備大一點的buffer,針對vertex、texture coord及color,分別使用glVertextPointer、glTexCoordPointer及glColorPointer餵給OpendGL,在最後使用glDrawArray繪出時再指定實際繪出的數量即可,這樣就能夠大符減少draw call。

使用glDrawArray批次繪製時發現,結果好像不怎麼正確,物件其中一個點總是會和其它物件的相連。後來發現原來是因為glDrawArray的mode參數是使用GL_TRIANGLE_STRIP,這樣一來會把整個buffer作一大塊連續內容繪出。解決方法是對buffer內容的排列稍作調整,glDrawArray的mode參數改為GL_QUAD,這樣就繪出正確的結果。

最後在移植android時又發現,GL_QUAD這個參數GLES是不支援的。為了解決這個問題,需要將glDrawArray改為glDrawElements並再提供一個index buffer,這樣就可以在手機上正確執行了。



Related Posts Plugin for WordPress, Blogger...