久久99热精品,久久国产精品久久,久久人人国产,国产精品久久久久久久久久嫩草,欧美伦理电影免费观看,国产女教师精品久久av,精品国产乱码久久久久久虫虫

一種靈活的網(wǎng)絡學習行為數(shù)據(jù)采集與分析系統(tǒng)論文

時間:2021-04-25 11:01:07 論文 我要投稿

一種靈活的網(wǎng)絡學習行為數(shù)據(jù)采集與分析系統(tǒng)論文

  摘要:網(wǎng)絡學習正在日益興起,在多樣化的教與學過程中充分利用網(wǎng)絡上日益豐富的學習資源,滿足不同層次求學者的需要。對網(wǎng)絡學習中學習者的各項學習行為進行分析,從中找出學習者群體的特征和個體的特點,從而幫助教育者促進網(wǎng)絡教與學的建設是目前迫切學要解決的問題。本文結合當前主流的學習行為數(shù)據(jù)采集和分析的方法的優(yōu)點和不足,提出了一種基于數(shù)據(jù)流獲取的網(wǎng)絡學習行為數(shù)據(jù)采集與分析的方案,詳細介紹了數(shù)據(jù)采集和數(shù)據(jù)分析的方法,并探討了實現(xiàn)這套方案的軟件系統(tǒng)設計。該軟件系統(tǒng)具有較強的靈活性和實用性,能夠幫助學習者和教育者進行更加有效網(wǎng)絡教與學。

一種靈活的網(wǎng)絡學習行為數(shù)據(jù)采集與分析系統(tǒng)論文

  關鍵詞:網(wǎng)絡學習;學習行為數(shù)據(jù)采集;學習行為分析;數(shù)據(jù)流獲;文本挖掘

  1.引言

  現(xiàn)代教育教學除了傳統(tǒng)的課堂教學和實踐培訓外,越來越多地采用了網(wǎng)絡學習的方式。網(wǎng)絡學習可以分為兩種類型,一種是集中式網(wǎng)絡學習,比如遠程網(wǎng)絡教育以及企事業(yè)內(nèi)部網(wǎng)絡的業(yè)務培訓;一種是發(fā)散式網(wǎng)絡學習,比如在學生在互聯(lián)網(wǎng)上廣泛、分散地查閱資料等自主學習。不論哪一種方式的網(wǎng)絡學習都能在多樣化的教與學過程中,充分利用網(wǎng)絡上日益豐富的學習資源,滿足不同層次求學者的需要。

  對網(wǎng)絡學習中學習者的各項學習行為進行分析,從中找出學習者的學習規(guī)律,可以幫助教育者不斷修正目前還不成熟的網(wǎng)絡學與教,促進網(wǎng)絡教育的建設。

  對網(wǎng)絡學習者的學習行為進行分析,首先需要采集學生在網(wǎng)絡學習過程中的學習行為信息數(shù)據(jù),然后對這些數(shù)據(jù)進行集成、分類和分析。目前,基于計算機和網(wǎng)絡平臺的網(wǎng)絡學習行為數(shù)據(jù)采集與分析的常用方法主要有兩類,一是基于Web服務(Web Services)的方法[1][2],一是基于Web日志挖掘(Web Usage Mining)的方法[3][4]。目前,基于Web Services的方法應用較多,但這種方法也存在比較明顯的不足,主要是:只能得到在該網(wǎng)站進行學習的注冊學習者的學習行為數(shù)據(jù),并對他們的學習行為進行分析,具有局限性;這樣的系統(tǒng)開發(fā)要與網(wǎng)站程序的設計以及數(shù)據(jù)庫設計同步進行,才能做到無縫集成,專用性強,靈活性較差。Web Usage Mining的不足在于Web日志和客戶端數(shù)據(jù)不容易得到,即使得到了,也和Web安全的相關原則有沖突,而且這些數(shù)據(jù)都是學習者通過該Web服務器時留下的,同樣存在局限性。

  通過實際對比分析和研究發(fā)現(xiàn),如果能結合上述兩者,就將是一種比實用的解決方案。本方案的基本思路是:在服務器或網(wǎng)關上使用netmate進行數(shù)據(jù)流捕獲,然后處理并輸出為文本,然后使用文本挖掘的成熟算法進行處理,得到網(wǎng)絡學習者學習的特點、偏好等學習規(guī)律,幫助教育者進行教育學分析,從而有效地指導網(wǎng)絡學習和教學的建設。

  2.學習行為數(shù)據(jù)采集

  學習行為數(shù)據(jù)的采集是進行學習行為分析的前提,是整個方案的基礎。學生網(wǎng)絡學習行為數(shù)據(jù)的采集是一種基于開源軟件netmate的數(shù)據(jù)流自動獲取,這種方式很容易對流經(jīng)節(jié)點服務器或網(wǎng)關的數(shù)據(jù)流進行實時獲取,然后回根據(jù)netmate提供的接口,生成文本已備后續(xù)的文本處理。

  2.1數(shù)據(jù)流獲取

  數(shù)據(jù)流獲取是網(wǎng)絡學習行為數(shù)據(jù)采集的第一步。這種獲取是實時的、基于隨機樣本的,由于樣本容量可以取很大,即使出現(xiàn)丟包的情況,也能夠接近實際情況。由于經(jīng)過節(jié)點服務器或者網(wǎng)關的數(shù)據(jù)流既有流入的也有流出的,因此既能夠獲取到學習者在站或者內(nèi)部網(wǎng)絡上的集中式學習的行為數(shù)據(jù),又能夠獲取到學習者通過服務器或網(wǎng)關進入互聯(lián)網(wǎng)絡的發(fā)散式學習的行為數(shù)據(jù)。由此可見,這樣的基于數(shù)據(jù)流的網(wǎng)絡學習行為數(shù)據(jù)采集能夠滿足前述兩種主要的網(wǎng)絡學習方式。

  首先要在節(jié)點服務器或者網(wǎng)關計算機上安裝好netmate及配套的庫(libpcap、readline),然后根據(jù)數(shù)據(jù)獲取的需求在配置文件(netmate.conf.xml)中進行配置,主要是根據(jù)需求制定自己的規(guī)則(rule)。在netmate工作過程中,根據(jù)制訂好的規(guī)則,會將獲取到的數(shù)據(jù)流以指定的形式進行輸出。

  由于netmate部署的位置可以根據(jù)需要而改變,獲得的文本可以通過傳送工具傳到指定的目的主機,因此具有很強的靈活。在集中式網(wǎng)絡學習中,如果獲取點在遠程教育網(wǎng)站上,則可以獲取在該網(wǎng)站學習的所有學習者的學習信息,如果獲取點在校園網(wǎng)的Web服務器上,就可以獲取該校校園網(wǎng)絡學習資源的利用情況;在發(fā)散式網(wǎng)絡學習中,如果獲取點在校園網(wǎng)的網(wǎng)絡服務器上,就可以獲取全校學生在互聯(lián)網(wǎng)上的學習情況,如果獲取點在某個院系的`網(wǎng)關服務器上,就可以獲取該院系的學生在實驗室在各個時段的網(wǎng)絡學習情況。

  3.學習行為的文本挖掘

  文本挖掘也被稱作文本數(shù)據(jù)挖掘,是指從文本中得到高質(zhì)量的、事先未知的、可理解的信息的過程。在得到通過節(jié)點服務器的數(shù)據(jù)文本后,就可以進行文本分類,從中找出網(wǎng)絡學習行為的特點以及一些規(guī)律。

  3.1文本預處理

  在進行文本分類之前,須先對文本文檔進行預處理,并將信息存放在比文本數(shù)據(jù)更適合處理的數(shù)據(jù)結構中。對英文單詞而言,動詞的不同時態(tài)一般在動詞后加后綴表示(ing或ed),而單詞的基本意義還是在原形式上,這時就需要進行詞根還原,將一個詞加后綴后的形式還原為它們基本形式。對中文文本的理解在于正確地斷句,由于中文詞與詞之間沒有空格,因此在進行中文文本挖掘之前,需要對文本進行分詞處理,把中文的漢字序列切分成有意義的詞。

  在預處理的末期,將得到非常巨大的向量空間,這時需要進行特征降維處理。由于不同的標準對同一學習行為的界定原本就不是很明確,因此采用了卡方統(tǒng)計(CHI)算法進行特征選擇,接下來采用聚類方法進行特征提取。

  3.2文本分類

  在特征降維之后,應用分類器對文本分類。目前的分類器大致可分為兩類:基于統(tǒng)計的分類器和基于語義的分類器;诮y(tǒng)計的方法中,成熟的有中心法,樸素貝葉斯,支持向量機。基于語義的有決策樹等。通過比較算法實現(xiàn)的難度和算法能達到的精度,本案采用了基于統(tǒng)計的分類器,通過支持向量機算法來實現(xiàn)。

  4.采集和分析系統(tǒng)的設計

  通過前面的描述,對本案采集和分析系統(tǒng)進行了詳細地分析。

  系統(tǒng)的軟件設計結合前述采用的算法和工具,自行開發(fā)的一些軟件模塊,從而構成一個比較完整的采集和分析系統(tǒng)。軟件的結構如圖1所示。系統(tǒng)采用客戶機/服務器模式,數(shù)據(jù)流獲取與傳輸模塊作為客戶機端模塊,部署在獲取點計算機上,其余模塊作為服務器端模塊,部署在文本處理和分析的主機上。

  4.1數(shù)據(jù)流獲取與傳輸模塊

  數(shù)據(jù)流獲取與傳輸負責對網(wǎng)絡學習行為數(shù)據(jù)進行廣泛的采集,然后將數(shù)據(jù)傳輸?shù)街付ǖ闹鳈C上。如前所述,數(shù)據(jù)流獲取通過netmate進行,當配置為text輸出時,就會取得需要的數(shù)據(jù)流文本?紤]到當前網(wǎng)絡基本都是高速的,在獲取數(shù)據(jù)流的過程中對服務器的需求已經(jīng)很高,因此,將這些文本數(shù)據(jù)傳輸?shù)竭h程主機的學習行為樣本庫中,然后再進行離線處理和分析工作。遠程傳輸部分采用多線程的TCP套接字實現(xiàn)。recConfig也采用多線程的TCP套接字實現(xiàn),用來接收來自于遠程主機上Configer的參數(shù),對采集端的配置參數(shù)進行修正,然后重啟netmate和remTrans。

  4.2學習行為樣本庫

  學習行為樣本庫存放從各個獲取點得到學習行為數(shù)據(jù)樣本,并以文本文件形式存放。樣本庫中的文本根據(jù)其采集時間或者指定來源進行簡單檢索4.3文本分析模塊文本分析模塊負責對學習行為樣本庫中的文本進行分析,包括文本預處理(Preproceed)、文本分類(Classify)、輸出(Export)和模式調(diào)整(RecModify)四個部分。PreProceed和Classify如前面敘述所設計。Export負責把經(jīng)過分類的文本數(shù)據(jù)輸出為Weka的數(shù)據(jù)格式,或者直接把各分類的數(shù)據(jù)統(tǒng)計結果輸出到屏幕。RecModify接收來自Modifer的模式調(diào)整參數(shù),并重啟PreProceed和Classify,以便對文本挖掘的調(diào)整馬上生效。

  4.4可視化顯示模塊

  可視化顯示模塊主要是利用Weka工具提供的可視化功能,對文本分析的結果進行顯示,或者做進一步的關聯(lián)規(guī)則分析并可視化輸出。

  4.5運行控制模塊

  運行控制模塊主要負責系統(tǒng)運行期間對數(shù)據(jù)獲取和文本分析兩個模塊的運行參數(shù)作調(diào)整,以便系統(tǒng)能夠靈活處理需求變化。其中,Configer針對netmate配置文件和遠程傳輸?shù)刂愤M行調(diào)整,為多線程TCP服務器套接字設計;Modier對文本預處理和文本分類的模式進行調(diào)整。

  結束語

  本文提出了一個比較靈活的網(wǎng)絡學習行為數(shù)據(jù)采集和分析系統(tǒng),采用了開源軟件工具和成熟的算法,在此基礎上進行軟件設計,從而實現(xiàn)網(wǎng)絡學習行為數(shù)據(jù)采集和學習行為的分析。遠程傳輸模塊的設計大大方便了對學習行為分析的本地化,在每個階段都設計了相應的反饋和調(diào)整模塊使得系統(tǒng)在運行過程中能適應具體環(huán)境。系統(tǒng)還處在試驗的階段,下一步將繼續(xù)完善與改進,除了分類算法改進外,結果可視化也需要改進。

  參考文獻:

  [1]Karin Anna Hummel,Helmut Hlavacs Anytime.AnywhereLearning Behavior Using a Web-Based Platform for a University Lecture.[EB/OLD.www.ani.univie.ac.at/hlavacs/publications/ssgrr_winter03.pdf,2006-3-1]

  [2]呂莉,張屹.基于Web服務的網(wǎng)絡學習行為采集研究現(xiàn)狀[J].開放教育研究,2009(15)

  [3]Chien-Sing Lee and YashwanL Prasud Singly.Student modelingusing Principle component analysis of SOM clusters.Proceedings of theIEEE International Conference on Advanced Learning Technologies,2004

  [4]黎孟雄.基于Web挖掘的遠程教學質(zhì)量跟蹤系統(tǒng)設計[J].河南科技大學學報,2007(28)

  [5]黃克斌,王鋒,王會霞.智能化網(wǎng)絡學習行為分析系統(tǒng)的設計與實現(xiàn)[J].中國教育信息化,2008(3)

【一種靈活的網(wǎng)絡學習行為數(shù)據(jù)采集與分析系統(tǒng)論文】相關文章:

教育消費的心理與行為分析01-19

《簡單的數(shù)據(jù)分析》說課稿10-09

系統(tǒng)的基本特性分析說課稿11-02

《法律是一種特殊的行為規(guī)范》說課稿11-12

我最敬佩的一種行為小學作文11-15

學生質(zhì)量考核系統(tǒng)的制度分析12-06

中職生學習心理障礙分析及對策 德育論文12-05

網(wǎng)絡學習教學反思08-22

《錯誤也是一種財富》論文12-05

淺析盲童心里與行為問題選修教學論文04-26

乌兰县| 永州市| 海丰县| 哈巴河县| 岗巴县| 获嘉县| 井冈山市| 措勤县| 泰顺县| 高阳县| 菏泽市| 扶绥县| 大余县| 萝北县| 兴义市| 永兴县| 石屏县| 丰顺县| 永宁县| 宁夏| 安西县| 饶阳县| 政和县| 衡南县| 桂平市| 钦州市| 尉氏县| 枣强县| 新丰县| 宜春市| 石柱| 白玉县| 文登市| 浦江县| 大荔县| 霍城县| 泾川县| 临沭县| 习水县| 抚松县| 麻城市|