好不容易,好不容易,又到了秀批畢業的時刻了....
這次畢業秀批又要到哪邊闖蕩了呢?這次秀批要跟阿漳哥一起到Cambodia(柬埔寨)+Ankgor(吳哥窟)+Vietnam(越南)玩耍十二天,而且是自助背包客(刻苦)行程!!!!(必須要強調刻苦是因為,真的很刻苦...連水都自己帶了三天份XD)
先來說說第一天的行程:
7:45am桃園機場登機(乘坐越南航空,Vientnam Airline)→9:15越南胡志明(Ho-chi-ming)機場轉機→柬埔寨暹粒(Siem Reap)機場→乘坐嘟嘟(Tuk Tuk)車到這幾天要住的地方(New Riverside)→吃個午餐→逛老市場(Old Market)→洞頂薩湖→吃晚餐→買啤酒(這是出來混一定要有的東西)
桃園機場就不用說了,到達越南機場後,阿漳哥很慌張的以為快到登機時間了 (但實際上時差一小時,所以還有一個小時多要等待),到了登機門,被空姐告知還不能登機 (越南話+國語唷XD),於是乎我們就等阿等,想說東南亞的生活步調慢到連飛機都誤點嗎?之後經過阿批仔細推敲,發現忘了算時差拉~~~趕緊調一下手錶的時間,免得之後行程出現烏龍派出所~
從越南到柬埔寨所乘坐的是小飛機,飛機上會供應餐點,但是是三明治(麵包裡面夾著火腿和一些東西)、花生和小杯杯水(容量大約是一般杯水的二分之一),重點是,全部都是冰冰冷冷的,但是很好吃(重點中的重點),阿批不吃花生,但是阿漳哥很愛,所以阿批把花生留到晚上請阿漳哥喝酒的時候當下酒菜配!
來到暹粒機場後,會發現,疑....要自己用走的?是的,要自己走走走,走到簽證處辦理入境簽證,以下有附最新的簽證圖表解說:
阿批備註:有些海關會跟你伸手要錢,不然就拖你的時間,基本上她們不會拖很久,頂多是這個班機所有人都過了你最後一個拿到而已,所以不要急著給錢(如果你是商務客就另當別論,湯姆就是馬力阿!),阿批還沒遇過伸手要錢的狀況(大概人長的傻傻的海關覺得我也不懂他要幹麻吧!不然就是...因為女生比較吃香XDDD,但是目前人還在越南,所以還有最後一個離境手續,所以可能會遇到也說不定,結論就是:裝傻是王道!)
領完行李,來到暹粒機場的門口,看到一堆嘟嘟車司機拿著名牌找人(場景頗壯觀,但是沒閒暇拍照請各位客倌見諒)。看到了拿著阿漳哥名字的嘟嘟車司機,我們趕緊走過去並向他表示我們就是跟他預約這幾天要搭乘嘟嘟車的客人。
阿批備註:嘟嘟車司機叫做蔡明光(Korng),叫他阿光就可以了。是一個人從金邊到吳哥窟這邊討生活的有為青年(只大阿批一歲喔...雖然大家也不知道阿批幾歲XD),我們在這幾天的旅程中都會跟他學習柬語,令阿批感到慚愧的是,不管什麼語言,只要跟阿光提到,他都很有興趣學習,隨身會帶著一本筆記本,將你所講的一些常用單字紀錄下來,隔天還會用你交的字跟你交談,真的是很認真學習的青年(雖然說是為了討生活必須要學其他語言,但是認真的態度,阿批覺得自己還比不上,但是阿批也很認真的請他寫了當地的文字和說法,了解一些基本的柬語)
首先來到我們這幾天要休息的地方:New Riverside。一晚20USD,這邊的建議攻略是,在跟阿光接洽時,阿光會詢問是否有旅館,他會介紹這一間給你,並表示這是他朋友開的,他可以拿友情價15USD,含早餐、有寄放服務、泳池,但是重點是離市區有點遠,所以有嘟嘟車會比較方便。
阿批備註:阿批總覺得在國外台灣人很不被重視,吃個早餐外國人都是送到面前,就只有台灣人要自己去拿,不拿還敲鈴叫人,不過到最後阿批還是堅持沒聽到,讓她們送上來(氣憤),也有打算跟阿光講這件事,畢竟這也關係到他的事業:P
今日花費:
cambodia entry visa 20
live 7.5
lunch 1
dinner 1.75
night food 2.75
boat 15
tuktuk 3
番外:趁著等飛機的空檔到處走走,阿批也去上了一下廁所,然後從廁所出來就被掃廁所的歐巴桑笑著似乎在跟我說:男廁在那邊啦,你走錯了!.....重點是她還笑很大聲,我只好假裝聽不懂離開(不過說實在的我真的也聽不懂QQ),
20100705
20100512
可以127.0.0.1卻無法localhost,一切都是IPv6搞的鬼!!
最近家族主機要搬遷,搬遷過程中也遇到一些稀奇古怪的問題
燈燈燈燈~~~~就是這個小傢伙害我老了兩個小時(好奇怪的單位....)
阿批今天所遇到的問題,由於在網路上查來查去,試了很多方法,都於事無補之下....
找到新門路!!!!!(太久沒有寫網誌,現在感覺寫得字都醜醜的......好像沒關係齁= =a)
今天裝完wamp server後,發現....咦!!!!!!!為何無法用http://localhost看到熟悉的網站呢!!!?但是用127.0.0.1卻可以(如果連這個也不行......請大力踹電腦幾下,你就可以換新電腦了~XDDDD)
於是乎,找遍所有網站,下了千萬變的關鍵字(阿批是很有研究精神的)....就是解決不了
但是在找到的這些資料的同時,阿批卻想到一個問題
協定!!!???IP!!!!????
後來查了一下許多設定發現hosts檔案裡存在這一行:::1 localhost,這就表示.........IPv6協定將localhost導向1.......
就因為這樣.....
我浪費了大好青春(我還有一堆CASE明天要交阿~~~~吶喊)
來吧。鄉民說得好,沒圖沒真像,阿批就剪了一張圖下來給大家看
燈燈燈燈~~~~就是這個小傢伙害我老了兩個小時(好奇怪的單位....)解法就是:將IPv6協定殺了....你就可以快樂的享用http://localhost
其實,還有另一個解法.....如果你執意一定要開IPv6呢!!!???好吧,那host檔就必須要妥協,請到c:\windows\system32\driver\etc裡打開hosts檔案,然後將原本的導向改成:
127.0.0.1 localhost localhost4
::1 localhost4 localhost6
::1 localhost4 localhost6
好,祝大家享用愉快~~~~
20100313
拖稿的補償-有深度的十句話
- 如果我們之間有1000步的距離,你只要跨出第1步,我就會朝你的方向走其餘的999步。
- 冷漠,有時候並不是無情,只是一種避免被傷害的工具。
- 通常願意留下來跟你爭吵的人,才是真正愛你的人。
- 付出真心才會得到真心,卻也可能傷得徹底。保持距離就能保護自己,卻也注定永遠寂寞。
- 有時候不是對方不在乎你,而是你把對方看得太重。
- 朋友就是把你看透了,還能喜歡你的人。
- 就算是believe,中間也藏了一個"lie"。
- 真正的好朋友,並不是在一起就有聊不完的話題。而是在一起,就算不說話,也不會感到尷尬。
- 沒有一百分的另一半,只有五十分的兩個人。
- 為你的難過而快樂的,是敵人﹔為你的快樂而快樂的,是朋友﹔為你的難過而難過的,就是那些該放進心裡的人。
20100225
網頁內嵌編輯器(Fckeditor+Filemanager),讓你的網頁圖文並茂
今年的天氣不曉得是怎麼搞得~去大陸沒遇到下雪,回國隔天就下了...
接著過年一整天都沒出去,因為都在下雨T_T....
然後....阿批也有CASE要趕,所以只好....也乖乖待在家做CASE...
anyway....還是得做,就算世界末日也要做完阿(誤).....
----------我是言歸正傳的分隔線--------------
越來越多網站後台都會須要用到編輯器,一來是可以讓一些使用者更方便的編輯,二來有些人不想要寫程式,可以用編輯器蒙混一下(XD),再來就是.....阿批拖稿拖太久~連老師都看不下去了(誤)
這篇文章要介紹的是阿批最近使用的一款編輯器-Fckeditor
這款編輯器目前已有更新的強化版-Ckeditor...但是,卻沒有阿批想要的功能-圖片上傳 Orz,讓原本使用Ckeditor的阿批,瞬間被丟到垃圾山(喔~其實是心情跌到谷底拉~)...其實有第三方作者寫的程式一樣可以支援上傳,但只能做簡易的上傳,至於真的需要上傳的朋友可能還是不夠用,因此這篇文章還是以Fckeditor無痛內嵌為主!
雖說Ckeditor是較新的版本,但對像阿批這種其實是跟一般的Fckeditor使用者沒有甚麼差別。而基於想要更方便的(其實是懶惰...)使用圖像上傳功能,於是download了Fckeditor來玩玩....
Fckeditor跟Ckeditor都是同一家公司的,所提供的原始碼都是免費的。而雖然Ckeditor較新且功能完整,但使用Fckeditor的網站還是佔多數(當然要尋求幫助也比較有門路)。可以先至官網玩玩看Demo的版本,但Demo版以Ckeditor為主,(上面的上傳圖片功能是騙人的:P,下載後不會有)。
首要工作:認識一下會用到的檔案吧!
1.打開你要置入的php頁面,加入:
include_once(“./fckeditor/fckeditor.php”) ; //呼叫fckeditor設定檔,也可把此檔放在你的include資料夾方便分類
$editor = new FCKeditor(‘fck_editor′) ; //new一個物件來用,要傳送的變數名稱,可自行修改
$editor ->BasePath = ‘./fckeditor/’ ; //Fckeditor的路徑
$editor ->ToolbarSet = 'Default' ;
$editor ->Value = ‘Hello World’ ; //要顯示在編輯器內的預設文字,你可以把資料庫抓出來的內容變數丟在這邊。
$editor ->Width = ‘500′; //編輯器寬度
$editor ->Height = ‘400′; //編輯器高度 "; ";
2.因為要有參數傳送的路徑,所以我們給個Form,直接承上接續(方法不一定要照此,可自行變化)
echo "< /form action="接收的頁面路徑" method="post"> "; //建立表單(因網至設定問題,直接複製請把form前的斜線(/)拿掉
$editor ->Create() ; //建立FCKeditor編輯器的物件
echo "< /form>"; //結束form
3.以上程式碼已可顯示一個編輯器以供使用,但現今的網站都有搭配後端資料庫,故以下提供簡短的接收DATA的程式碼做接收示範
$content = $_POST['fck_editor'];
//接收編輯器的內容變數,因編輯器所Create時的變數為第1步驟程式碼所設定,故需一至(本例以fck_editor為變數名稱)
設定完以上的程式碼,就可以先玩一下編輯器了~OK~大功告成!!!總算........不對,還有圖片上傳功能啊!!!!
別急著走開~以下我們要介紹上傳圖片的設定,當然也是非常無痛的設定!
在首要準備工作的第三個檔案,位於fckeditor/editor/filemanager/connectors/php/內,因阿批是使用php,所以就進入php資料夾來設定(若是其他語言的使用者則可以選擇其他的程式語言資料夾),內有一config.php檔案,打開並設定:
$Config['Enabled'] = true ; //預設是關閉的,只要將它設為true就可以開啟圖片上傳功能。
其他的設定在config檔案裡都有說明,路徑、擴充套件等等,就讓大家自己摸摸啦!!不然就等下次的教學文(誤!)OK~這次真的是大功告成!!!可以再偷懶一陣子了~XD
接著過年一整天都沒出去,因為都在下雨T_T....
然後....阿批也有CASE要趕,所以只好....也乖乖待在家做CASE...
anyway....還是得做,就算世界末日也要做完阿(誤).....
----------我是言歸正傳的分隔線--------------
越來越多網站後台都會須要用到編輯器,一來是可以讓一些使用者更方便的編輯,二來有些人不想要寫程式,可以用編輯器蒙混一下(XD),再來就是.....阿批拖稿拖太久~連老師都看不下去了(誤)
這篇文章要介紹的是阿批最近使用的一款編輯器-Fckeditor
這款編輯器目前已有更新的強化版-Ckeditor...但是,卻沒有阿批想要的功能-圖片上傳 Orz,讓原本使用Ckeditor的阿批,瞬間被丟到垃圾山(喔~其實是心情跌到谷底拉~)...其實有第三方作者寫的程式一樣可以支援上傳,但只能做簡易的上傳,至於真的需要上傳的朋友可能還是不夠用,因此這篇文章還是以Fckeditor無痛內嵌為主!
雖說Ckeditor是較新的版本,但對像阿批這種其實是跟一般的Fckeditor使用者沒有甚麼差別。而基於想要更方便的(其實是懶惰...)使用圖像上傳功能,於是download了Fckeditor來玩玩....
Fckeditor跟Ckeditor都是同一家公司的,所提供的原始碼都是免費的。而雖然Ckeditor較新且功能完整,但使用Fckeditor的網站還是佔多數(當然要尋求幫助也比較有門路)。可以先至官網玩玩看Demo的版本,但Demo版以Ckeditor為主,(上面的上傳圖片功能是騙人的:P,下載後不會有)。
首要工作:認識一下會用到的檔案吧!
- fckconfig.js:工具列設定、外觀設定...等等都靠它!
- fckeditor.php:有提供php用的呼叫函式和功能。因為阿批是寫PHP,當然就要找它來幫我呼叫嚕!
- fckeditor/editor/filemanager/connectors/php/config.php:圖片上傳的設定檔,稍後用到
- 傳送及接收參數的頁面:放心,這邊阿批會寫一點範例給大家先玩玩!
1.打開你要置入的php頁面,加入:
include_once(“./fckeditor/fckeditor.php”) ; //呼叫fckeditor設定檔,也可把此檔放在你的include資料夾方便分類
$editor = new FCKeditor(‘fck_editor′) ; //new一個物件來用,要傳送的變數名稱,可自行修改
$editor ->BasePath = ‘./fckeditor/’ ; //Fckeditor的路徑
$editor ->ToolbarSet = 'Default' ;
$editor ->Value = ‘Hello World’ ; //要顯示在編輯器內的預設文字,你可以把資料庫抓出來的內容變數丟在這邊。
$editor ->Width = ‘500′; //編輯器寬度
$editor ->Height = ‘400′; //編輯器高度 "; ";
2.因為要有參數傳送的路徑,所以我們給個Form,直接承上接續(方法不一定要照此,可自行變化)
echo "< /form action="接收的頁面路徑" method="post">
$editor ->Create() ; //建立FCKeditor編輯器的物件
echo "< /form>"; //結束form
3.以上程式碼已可顯示一個編輯器以供使用,但現今的網站都有搭配後端資料庫,故以下提供簡短的接收DATA的程式碼做接收示範
$content = $_POST['fck_editor'];
//接收編輯器的內容變數,因編輯器所Create時的變數為第1步驟程式碼所設定,故需一至(本例以fck_editor為變數名稱)
設定完以上的程式碼,就可以先玩一下編輯器了~OK~大功告成!!!總算........不對,還有圖片上傳功能啊!!!!
別急著走開~以下我們要介紹上傳圖片的設定,當然也是非常無痛的設定!
在首要準備工作的第三個檔案,位於fckeditor/editor/filemanager/connectors/php/內,因阿批是使用php,所以就進入php資料夾來設定(若是其他語言的使用者則可以選擇其他的程式語言資料夾),內有一config.php檔案,打開並設定:
$Config['Enabled'] = true ; //預設是關閉的,只要將它設為true就可以開啟圖片上傳功能。
其他的設定在config檔案裡都有說明,路徑、擴充套件等等,就讓大家自己摸摸啦!!不然就等下次的教學文(誤!)OK~這次真的是大功告成!!!可以再偷懶一陣子了~XD
20090901
在Vista的中心呼喊"執行"
喔~這可不是新的作業系統影片~也不是任何有關作業系統的影片
這完全是最近有些人及阿批的疑問...
使用Vista的朋友一定(其實也不一定)會疑惑..
XP的"開始"→"執行"小功能似乎在Vista裡消失了...
看來繼消失的密室之後....喔~不是....這完全跟電影無關....
咱們來將"消失的執行"呼喊出來吧.....(被踹)
首先請在可愛的"開始"鈕上按下"右鍵",選擇"內容"
然後點選"開始功能表"標籤

點選"自訂"

勾選"執行命令",接著按下"確定"

再次開啟開始功能表,登登登登~~~出現了~~~請各位客官盡情享用!!
這完全是最近有些人及阿批的疑問...
使用Vista的朋友一定(其實也不一定)會疑惑..
XP的"開始"→"執行"小功能似乎在Vista裡消失了...
看來繼消失的密室之後....喔~不是....這完全跟電影無關....
咱們來將"消失的執行"呼喊出來吧.....(被踹)
首先請在可愛的"開始"鈕上按下"右鍵",選擇"內容"
然後點選"開始功能表"標籤 
點選"自訂"

勾選"執行命令",接著按下"確定"

再次開啟開始功能表,登登登登~~~出現了~~~請各位客官盡情享用!!

20090702
My Note - K-means Cluster
K-means 分群法
使用分割式分群法(partitional clustering)時,必須先指定群聚的數目,然後藉著反覆疊代運算,逐次降低一個誤差目標函數的值,直到目標函數不再變化,就達到分群的最後結果。
在所有的分割式分群法之中,最基本的方法,就是所謂的 K-means 分群法(k-means clustering),又稱為Forgy's algorithm。主要目標是在大量高維的資料點中找出具有代表性的資料點,這些資料點可以稱為是群中心(cluster centers)、代表點(prototypes)、codewords等,然後在根據這些群中心,進行後續的處理,這些處理可以包含:
1.資料壓縮:以少數的資料點來代表大量的資料,達到資料壓縮的功能。2.資料分類:以少數代表點來代表特定類別的資料,可以降低資料量及計算量,並可以避免雜訊的不良影響。分割式分群法的目的是希望盡量減小每個群聚中,每一點與群中心的距離平方誤差(square error)。E = Sk=1~c ek分群的方法,就變成是一個最佳化的問題,換句話說,要如何選取 c 個群聚以及相關的群中心,使得 E 的值為最小。 也可以用另一方式來描述,給定一組 n 點資料 X = {x1, ..., xn},每一點都有 d 維,k-means 分群法的任務是找到一組 m 個代表點 Y = {y1, ..., ym},每一點也是d維,以使下列的目標函數越小越好: J(X; Y, U) = Si=1nxi-yk2在演算法開始進行前,必須事先決定好預期分群的群聚數目。假設預期的分群群聚數目為c,則根據上述觀察,可經由下列步驟來進行 k-means 分群法: 1.隨機選取 c 個資料點,將之分別視為c 個群聚的群中心,這就是Y。 2.由固定的Y,產生最佳的U。換句話說,對每一個資料點x,尋找與之最接近的群中心,並將x加入該群聚。 3.計算目標函數 J(X; Y, U),如果保持不變,代表分群結果已經穩定不變,所以可以結束此疊代方法。 4.再由固定的U,產生最佳的Y。跳回第2個步驟。由於只能找到局部最小值,所以如何選一組好的起始點,就變得很重要。以上述方法來說,若要選取 c 個起始中心典,常用的選取方法有下列幾種: 1.從資料裡面隨意選出 c 點資料2.找出離所有資料平均值最遠的 c 個資料點3.找出離所有資料平均值最近的 c 個資料點 4.找出距離平方和最小的 c 個資料點上述討論的方法,通常又稱為 batch k-means algorithm,另一個類似的方法稱為 sequential k-means algorithm 或是 on-line k-mean algorithm,則是每當收集到一筆資料時,就可以更新群中心,方法如下: 1.隨機選取c的起始點,將之分別視為c個群聚的群中心 2.對每一個資料點x,尋找與之最接近的群中心,並將x加入該群聚,隨即計算新的群聚中心(該群聚中原有的資料點加上x後的平均向量) 3.檢查每一個資料點目前與之最接近的群聚中心是否和他的群聚分配一致,如果不是,則回到步驟二,反覆疊代,直到收斂。 一般而言, sequential k-mean algorithm的優點如下: 1.適用於資料特性隨時間而變的情況。 2.計算簡單,適用於硬體實現。
除非有特殊情況,否則很少使用 sequential k-mean algorithm。
發現叢集(Discovering Group, Clustering)
群集分析(cluster analysis)又稱為資料切割(data segmentation)、非監督式分分類(unsupervised classification),他是一種多變量統計分析(multivariate statistical analysis)的技術,主要目的是將資料集合中的資料紀錄,又稱為資料點、觀察值或案例,加以分群成數個群集(cluster),使的每個群集中的資料點間相似程度高於其他群集中資料點的相似程度。因此群集分析主要的杜地在於分析資料彼此間的相似程度,藉由分析所找到的群集結果,推論出有用、隱含、令人感興趣的特性和現象。相對於分類法中每一筆訓練資料紀錄都給訂一個類別資訊,並企圖從中找出一個判斷模式來預測未知類別資訊得資料紀錄;在群集分析的過程中,並沒有預先指定好的類別資訊,也沒有任何資訊可以表示資料紀錄彼此之間是相關的,所以群集分析被視為一個非監督式學習(unsupervised learning)的過程。
群集在data mining中所扮演的角色:
*資料精簡:透過群集分析將原本大量的資料加以分群成數個群集,並從每一個群集中挑選具有代表性的資料
記錄來進行後續的處理。
*推論假設的產生:利用群集分析推斷出所關注資料中可能存在的某些特性或現象。
*推論假設的驗證:可以對推論假設作有效性的驗證。
*歸屬預測:將群集分析後的分群結果應用於未知分類之資料記錄上,以預測資料所歸屬的群集。
資料分群(data clustering)或是分群演算法(clustering algorithms)是一種將資料分類成群的方法,其主要的目的乃在於找出資料中較相似的幾個群聚(clusters),並找出各個群聚的代表點,稱為中心點(centroids)或是原型(prototypes)。使用這些中心點來代表原先大量的資料點,就可以達到兩個基本目標:
降低計算量
資料壓縮
一般而言,分群法可以大致歸為兩大類:
階層式分群法(hierarchical clustering):群數(number of clusters)可以由大變小,或是由小變大,來進群聚的合併或分裂,最後再選取最佳的群數。
分割式分群法(partitional clustering):先指定群數後,再用一套疊代的數學運算法,找出最佳的分群方式以及相關的群中心。
所有的分群法都有相似的流程,大略可歸納為下列三點:
收集資料
使用某種方法進行分群
測試分群結果
檢測分群結果,如果未達預期效果,則回到步驟二,再一次進行分群
使用分割式分群法(partitional clustering)時,必須先指定群聚的數目,然後藉著反覆疊代運算,逐次降低一個誤差目標函數的值,直到目標函數不再變化,就達到分群的最後結果。
在所有的分割式分群法之中,最基本的方法,就是所謂的 K-means 分群法(k-means clustering),又稱為Forgy's algorithm。主要目標是在大量高維的資料點中找出具有代表性的資料點,這些資料點可以稱為是群中心(cluster centers)、代表點(prototypes)、codewords等,然後在根據這些群中心,進行後續的處理,這些處理可以包含:
1.資料壓縮:以少數的資料點來代表大量的資料,達到資料壓縮的功能。2.資料分類:以少數代表點來代表特定類別的資料,可以降低資料量及計算量,並可以避免雜訊的不良影響。分割式分群法的目的是希望盡量減小每個群聚中,每一點與群中心的距離平方誤差(square error)。E = Sk=1~c ek分群的方法,就變成是一個最佳化的問題,換句話說,要如何選取 c 個群聚以及相關的群中心,使得 E 的值為最小。 也可以用另一方式來描述,給定一組 n 點資料 X = {x1, ..., xn},每一點都有 d 維,k-means 分群法的任務是找到一組 m 個代表點 Y = {y1, ..., ym},每一點也是d維,以使下列的目標函數越小越好: J(X; Y, U) = Si=1nxi-yk2在演算法開始進行前,必須事先決定好預期分群的群聚數目。假設預期的分群群聚數目為c,則根據上述觀察,可經由下列步驟來進行 k-means 分群法: 1.隨機選取 c 個資料點,將之分別視為c 個群聚的群中心,這就是Y。 2.由固定的Y,產生最佳的U。換句話說,對每一個資料點x,尋找與之最接近的群中心,並將x加入該群聚。 3.計算目標函數 J(X; Y, U),如果保持不變,代表分群結果已經穩定不變,所以可以結束此疊代方法。 4.再由固定的U,產生最佳的Y。跳回第2個步驟。由於只能找到局部最小值,所以如何選一組好的起始點,就變得很重要。以上述方法來說,若要選取 c 個起始中心典,常用的選取方法有下列幾種: 1.從資料裡面隨意選出 c 點資料2.找出離所有資料平均值最遠的 c 個資料點3.找出離所有資料平均值最近的 c 個資料點 4.找出距離平方和最小的 c 個資料點上述討論的方法,通常又稱為 batch k-means algorithm,另一個類似的方法稱為 sequential k-means algorithm 或是 on-line k-mean algorithm,則是每當收集到一筆資料時,就可以更新群中心,方法如下: 1.隨機選取c的起始點,將之分別視為c個群聚的群中心 2.對每一個資料點x,尋找與之最接近的群中心,並將x加入該群聚,隨即計算新的群聚中心(該群聚中原有的資料點加上x後的平均向量) 3.檢查每一個資料點目前與之最接近的群聚中心是否和他的群聚分配一致,如果不是,則回到步驟二,反覆疊代,直到收斂。 一般而言, sequential k-mean algorithm的優點如下: 1.適用於資料特性隨時間而變的情況。 2.計算簡單,適用於硬體實現。
除非有特殊情況,否則很少使用 sequential k-mean algorithm。
發現叢集(Discovering Group, Clustering)
群集分析(cluster analysis)又稱為資料切割(data segmentation)、非監督式分分類(unsupervised classification),他是一種多變量統計分析(multivariate statistical analysis)的技術,主要目的是將資料集合中的資料紀錄,又稱為資料點、觀察值或案例,加以分群成數個群集(cluster),使的每個群集中的資料點間相似程度高於其他群集中資料點的相似程度。因此群集分析主要的杜地在於分析資料彼此間的相似程度,藉由分析所找到的群集結果,推論出有用、隱含、令人感興趣的特性和現象。相對於分類法中每一筆訓練資料紀錄都給訂一個類別資訊,並企圖從中找出一個判斷模式來預測未知類別資訊得資料紀錄;在群集分析的過程中,並沒有預先指定好的類別資訊,也沒有任何資訊可以表示資料紀錄彼此之間是相關的,所以群集分析被視為一個非監督式學習(unsupervised learning)的過程。
群集在data mining中所扮演的角色:
*資料精簡:透過群集分析將原本大量的資料加以分群成數個群集,並從每一個群集中挑選具有代表性的資料
記錄來進行後續的處理。
*推論假設的產生:利用群集分析推斷出所關注資料中可能存在的某些特性或現象。
*推論假設的驗證:可以對推論假設作有效性的驗證。
*歸屬預測:將群集分析後的分群結果應用於未知分類之資料記錄上,以預測資料所歸屬的群集。
資料分群(data clustering)或是分群演算法(clustering algorithms)是一種將資料分類成群的方法,其主要的目的乃在於找出資料中較相似的幾個群聚(clusters),並找出各個群聚的代表點,稱為中心點(centroids)或是原型(prototypes)。使用這些中心點來代表原先大量的資料點,就可以達到兩個基本目標:
降低計算量
資料壓縮
一般而言,分群法可以大致歸為兩大類:
階層式分群法(hierarchical clustering):群數(number of clusters)可以由大變小,或是由小變大,來進群聚的合併或分裂,最後再選取最佳的群數。
分割式分群法(partitional clustering):先指定群數後,再用一套疊代的數學運算法,找出最佳的分群方式以及相關的群中心。
所有的分群法都有相似的流程,大略可歸納為下列三點:
收集資料
使用某種方法進行分群
測試分群結果
檢測分群結果,如果未達預期效果,則回到步驟二,再一次進行分群
20090519
PHP -利用mkdir函數建立中文資料夾無亂碼方案
因為自己龜毛,想要在家族的網站上設立一個為使用者開啟個人資料夾的功能,因為這樣可以讓使用者方便將自己的東西直接上傳到資料夾內(先前的網站必須還要由管理者移動),管理者才不用事後移來移去(其實管理者很懶惰XD)
於是乎
這種想法產生就也伴隨著無止盡的殘忍後果
正當我很高興的mkdir("0777","中文")給它時...
蝦米,是亂碼!!!!!!
好吧,既然他誠心誠意的出現了
我也要大發慈悲的解決他!!!!
我找阿找,找遍怕太太(這大概只有老一輩玩過BBS的人才知道這個名稱吧~)和X學園,不是建議用英文就是講一堆廢話然後叫你不要有這個想法(這我要特別提出來講是因為,如果有一天你老闆同樣交代了這件事,你會沒試過就要跟他說沒辦法嗎?雖然並非老闆要求,但這種不敬業的態度我做不到)
於是乎有位鄉民暗丟水球給我,跟我講了另一個方法可試試看,真是太感謝了!!!!
我就去找了iconv來玩玩
結果,壓呼!!!!壓倒性的勝利....喔不,是暫時解決了這個問題!!!!
好,於是我高興到想要將他PO出來,因為我真的找不到這個問題的解決方案,而且我有一些也要說明阿~~~~
來來來,做法是這樣
$dir_name=iconv("utf8", "big5", $dir_name); //將資料夾名稱編碼為big5,utf8是我寫程式所用的編碼
$path="upload/reports/$dir_name"; //路徑,我習慣額外設定
mkdir($path,'0777'); //建立資料夾!!!!
就是這樣~~喵~~~
各位看倌不曉得看這麼多廢話後,你有沒有豁然睜大雙眼的感覺!!?
於是乎
這種想法產生就也伴隨著無止盡的殘忍後果
正當我很高興的mkdir("0777","中文")給它時...
蝦米,是亂碼!!!!!!
好吧,既然他誠心誠意的出現了
我也要大發慈悲的解決他!!!!
我找阿找,找遍怕太太(這大概只有老一輩玩過BBS的人才知道這個名稱吧~)和X學園,不是建議用英文就是講一堆廢話然後叫你不要有這個想法(這我要特別提出來講是因為,如果有一天你老闆同樣交代了這件事,你會沒試過就要跟他說沒辦法嗎?雖然並非老闆要求,但這種不敬業的態度我做不到)
於是乎有位鄉民暗丟水球給我,跟我講了另一個方法可試試看,真是太感謝了!!!!
我就去找了iconv來玩玩
結果,壓呼!!!!壓倒性的勝利....喔不,是暫時解決了這個問題!!!!
好,於是我高興到想要將他PO出來,因為我真的找不到這個問題的解決方案,而且我有一些也要說明阿~~~~
來來來,做法是這樣
$dir_name=iconv("utf8", "big5", $dir_name); //將資料夾名稱編碼為big5,utf8是我寫程式所用的編碼
$path="upload/reports/$dir_name"; //路徑,我習慣額外設定
mkdir($path,'0777'); //建立資料夾!!!!
就是這樣~~喵~~~
各位看倌不曉得看這麼多廢話後,你有沒有豁然睜大雙眼的感覺!!?
訂閱:
文章 (Atom)
你還在幫別人打造舒適圈?
師不順路,不好為人師,談何容易.... 人總是在為自己的做法找"理由",找一個漂亮的包裝,找一個可以說服人的方式,找一個立足點....然而,這個為自己所做的一切,往往是一個自私的隱性表現,因為你要達到的就是"滿足"自己。 但要如何滿足自己...
-
今天阿批在新的iMAC上安裝Composer和Lavarel 因為原本就已經裝好MAMP了,想說那就照著Composer的步驟..... 結果一直說找不到PHP,金害捏.... 解法是:先打開MAMP後,啟動後,再開終端機拉!!!! 如果先開終端機,不會因為你開了MAMP他就自己...
-
字字句句,解釋我的話語 點點滴滴,寫出所有回憶 文字迷宮,表達我的心意 條列的字句,你,看不看的清 我的用心 ‧2004.10.30,育403,辰脩‧
-
最近家族主機要搬遷,搬遷過程中也遇到一些 稀奇古怪 的問題 阿批今天所遇到的問題,由於在網路上查來查去,試了很多方法,都 於事無補 之下.... 找到新門路!!!!!(太久沒有寫網誌,現在感覺寫得字都醜醜的......好像沒關係齁= =a) 今天裝完 wamp server 後,...