點擊數:22242015-03-03 16:24:35 來源: 千極科技,10年專注互聯網軟件開發
網站是我們的企業或者產品在互聯網的一個展現平臺,如何把它做好以及如何讓它的受眾或者消費者覺得好事非常重要的,因此在我網站的日常維護下一般們會分析一些網站的數據。比如網站訪客,獨立IP,跳出率啊等等這些,那么如何從這些繁雜的數據當中看出我們網站的端倪呢?
記憶基礎推理法中有兩個主要的要素,分別為距離函數(distance function)與結合函數(combination function)。距離函數的用意在找出相似的案例;結合函數則將相似案例的屬性結合起來,以供預測之用。記憶基礎推理法的優點是它容許各種型態的數據,這些數據不需服從某些假設。另一個優點是其具備學習能力,它能藉由舊案例的學習來獲取關于新案例的知識。
較令人詬病的是它需要大量的歷史數據,有足夠 的歷史數據方能做良好的預測。此外記憶基礎推理法在處理上亦較為費時,不易發現佳的距離函數與結合函數。其可應用的范圍包括欺騙行為的偵測、客戶反應預測、醫學診療、反應的歸類等方面。
決策樹在解決歸類與預測上有著極強的能力,它以法則的方式表達,而這些法則則以一連串的問題表示出來,經由不斷詢問問題終能導出所需的結果。典型的決策樹頂端是一個樹根,底部有許多的樹葉,它將紀錄分解成不同的子集,每個子集中的字段可能都包含一個簡單的法則。此外,決策樹可能有著不同的外型,例如二元樹、三元樹或混和的決策樹型態。
基因算法學習細胞演化的過程,細胞間可經由不斷的選擇、復制、交配、突變產生更佳的新細胞。基因算法的運作方式也很類似,它必須預先建立好一個模式,再經由 一連串類似產生新細胞過程的運作,利用適合函數(fitness function)決定所產生的后代是否與這個模式吻合,后僅有吻合的結果能夠存活,這個程序一直運作直到此函數收斂到佳解。基因算法在群集 (cluster)問題上有不錯的表現,一般可用來輔助記憶基礎推理法與類神經網絡的應用。