前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的圖書館學教育論文主題范文,僅供參考,歡迎閱讀并收藏。
我國圖書館學專業教育已形成了由專科教育,本科教育,碩士、博士教育組成的比較完整的教育體系。[1]隨著信息經濟時代的到來,圖書館工作重心發生了轉移,圖書館自動化、數字圖書館建設、特色資源數據庫建設、參考咨詢服務等工作已成為基層圖書館工作的核心內容。由于條件的限制,基層圖書館對圖書館學碩士、博士畢業生是可望不可即的,但是他們對于圖書館學本科畢業生還是寄予了厚望。他們理想中的本科畢業生是能很快適應圖書館工作,具有較強的敬業精神和扎實的專業知識,能給圖書館工作帶來技術上、理論上的指導,并且具有一定的圖書館管理知識的人才。然而,事實上基層圖書館盼來的相當一部分本科畢業生卻并不能給圖書館工作帶來預期的變化,于是他們便對圖書館學本科教育提出了質疑。
1圖書館學部分本科畢業生的工作表現
1.1不愿從事流通、閱覽服務第一線的工作
圖書館行業沒有準入制,基層圖書館員文化、業務素質都偏低,圖書館學本科生有一種優越感。其實流通閱覽工作是熟悉館藏和干好采訪、編目、參考咨詢工作的基礎,但他們沒有意識到這一點,又由于缺乏正確的職業價值觀,他們輕視流通、閱覽工作,不能正確認識到這些基礎工作的重要性,大多不愿從事第一線服務工作。
1.2不能很好地勝任專業技術和計算機技術含量高的工作
據統計,圖書館學本科畢業生在基層圖書館發揮作用最好的崗位是分類、編目,其次是文獻采訪。由于沒有較為系統的其他專業學科知識背景,計算機知識僅停留在操作層面,所以對于參考咨詢、管理系統和網絡的維護、數字圖書館的建設、軟件的開發等工作難以很快勝任。[2]
1.3圖書館管理知識貧乏,團隊精神與組織協調能力有待提高
基層圖書館的圖書館學本科生經過幾年的鍛煉,業務能力強的一般都能提拔成各部門的業務骨干,甚至業務館長。但在提拔后發現他們的管理能力、協調組織能力要經過一段長時間的鍛煉才能很好地發揮。
1.4專業思想不穩定
對基層圖書館來說,他們更多的是希望留住那些能為圖書館事業兢兢業業的館員,一個館員無論他多優秀,如果不安心圖書館工作,那也是白搭。由于受功利主義思潮的影響,一些本科畢業生不安心圖書館工作,希望得到更優厚的報酬、更輕松的工作、更高的社會地位,工作不到幾年考研、考公務員、跳槽、下海的較多,導致圖書館專業人才流失,圖書館技術性工作缺乏穩定性。
2對圖書館學本科教育的反思
2.1人才培養目標尺度把握不好
1998年教育部頒布的《普通高校本科專業目錄和專業介紹》中規定圖書館學專業培養目標為“培養具備系統的圖書館學基礎理論知識,能熟練地運用現代化技術手段收集、整理和開發利用文獻信息,能在圖書情報機構和各類企事業單位的信息部門從事信息服務及管理工作的應用型、復合型圖書館學高級專門人才”。從近幾年圖書館學本科生就業走勢看,還是以圖書館職業為主。目前我國西部地區圖書館、中小型圖書館、基層圖書館急需本科人才,這里還有很大的就業市場,其實圖書館本科畢業生要在基層圖書館找一份工作并不難,關鍵是他們眼光太高,沒有把基層圖書館放在眼里,拼命想往大城市的大圖書館鉆。圖書館專業教育具有層次性,本科教育的首要任務應該是為圖書館及相關部門具體工作培養操作型人才,而為圖書館學理論研究培養專家型人才應該是碩士、博士教育階段的首要任務。[3]所以,辦好圖書館學本科教育,首先應該解決的是為誰培養什么層次的人的問題,教學單位必須把握好人才培養目標定位,這是辦好圖書館學本科教育的基礎。
2.2課程設置欠合理
大多數學校考慮到招生和就業問題,盲目開設許多以信息、計算機、管理學命名的時髦課程,而把圖書學專業的核心課程壓縮到最低限度,導致圖書館學科核心課程的地位受到沖擊。[4]由于圖書學專業教師大多對計算機、法律、經濟、管理等學科知識了解不深,所授課程泛泛而談,導致學生對這些知識也是一知半解,結果圖書館本科教育想為社會培養萬金油人才的想法沒有實現,更糟糕的是培養出來的學生連圖書館工作都干不好。圖書館本科教育的首要任務是培養圖書館專業人才,那種課程設置盲目求全,妄想圖書學本科教育能為社會各行各業培養人才的做法是不現實的。
2.3教學內容過于陳舊
圖書館學教育面臨社會全球化、網絡化、知識化的挑戰,然而課程的講授仍然是傳統圖書館學的內容,沒有在數字、網絡環境下拓展和延伸。如在信息組織課程中,講授的仍是文獻分類法和主題法,而對網絡資源的有效組織的問題很少涉及。信息資源建設課程重點還停留在文獻采訪內容上,而對如何建立虛擬館藏,如何搜集評估專業數據庫、知識博客、新聞網站等網絡資源等問題缺少必要的探討,元數據介紹、電子資源編目等教學內容也沒有涉及。教學內容過于陳舊,出現嚴重滯后于圖書館工作發展需要的現象,導致相當一部分畢業生不能很快適應這些工作。
2.4師資隊伍建設有待加強,教學方法單一
中國圖書館學會2007年年會上,肖希明教授在《中國圖書館學專業教育與職業需求的調查報告》中,調查了38個學校的專業教師情況,調查結果為:教師年齡35歲以下的只占16%,表明教師隊伍有待年輕化;教師職稱結構呈倒金字塔形,35歲以下教授只有1人,表明后備力量不足;博士學歷的占29%、碩士學歷的占41%、本科學歷的占29%;教師學科背景為圖書館學一級學科的比例較大,近親繁殖現象比較嚴重。這一調查結果表明了我國圖書館學專業教師隊伍建設有待加強。教師來源大多是高校圖書館學畢業的碩士或博士生,他們從學校到學校沒有太多的圖書館工作實踐,所授專業課就變成純理論上的說教,教學與實踐脫節,不能激發學生的學習興趣。
3對圖書館本科教育的建議
3.1確保圖書館學專業特色,樹立圖書館學科核心課程的核心地位
應把傳統的圖書館學基礎理論和信息技術應用作為核心課程開設。傳統的圖書館學基礎理論課程:圖書館學基礎、文獻分類法與主題法、文獻編目、社科文獻檢索、科技文獻檢索、咨詢與決策、文獻計量學、文獻學概論、目錄學概論等是圖書館學區別于其他學科的最明顯的標志。[5]同時,圖書館學是一門技術性很強的應用科學,所以信息技術應用課程:數據庫建設與管理、圖書館自動化、計算機網絡基礎、網頁制作、信息組織與檢索等課程也是圖書館學科核心課程的重要組成部分。圖書館學本科教育課程體系的設置始終要圍繞其首先為圖書館培養操作型人才這一培養目標,正確處理好學科核心課程、通識課程與選修課程之間的關系,不能舍本逐末。那種盲目開設大量其他專業課程,過分加大其他專業課程比例而壓縮圖書館學專業課程的做法,將會使圖書館學本科教育迷失方向。
3.2重視隱性課程的開發
隱性課程亦稱為潛在課程、潛課程、內隱課程或非正式課程等。[6]隱性課程是學校通過物質的、制度的和精神的教育文化環境,有意或無意地傳遞給學生的非公開性的學術的與非學術的教育經驗。多年來困擾圖書館事業發展的一個重要的問題就是圖書館留不住優秀人才。基層圖書館本身條件不如大型圖書館,他們對專業思想的要求比大圖書館更高。事實上,職業思想的穩固和職業道德的培養靠單純的說教,效果并不明顯,而隱性課程作為道德教育的重要手段,往往比正規課程更有力,這一點恰恰被大多數教學單位忽略了,所以不重視隱性課程的開發是不明智的。可以聘請資深的有強烈的職業責任感又有淵博的學科知識的圖書館工作人員擔任教學工作,讓學生在教師的娓娓道來、游刃有余的教學活動中感覺到圖書館職業的魅力。實際上基層圖書館是非常重視人才的,他們對好不容易盼到的人才很注重培養,在深造、繼續教育、考察學習、晉職晉級、提拔等各方面都優先考慮,而且這些人才有更多機會熟悉圖書館各個環節的工作,這是大圖書館無法顧及的。事實上,不少基層圖書館造就了不少工作出色的圖書館學本科生。所以我們可以通過請這些學長回校做講座的方式來激發在校學生對圖書館職業的認同感。
3.3適應圖書館學發展和社會發展的需要,合理調整教學內容
圖書館學是一門與時俱進的學科,圖書館的學科內容本身也在與技術、社會發生聯系與變化,所以教學內容要不斷變化。[7]據2002年北京大學信息管理系圖書館學教研室的教育部“文科應用學科圖書館學人才培養模式綜合改革研究與實踐”報告調查顯示:計算機、網絡等高新技術在圖書館中應用比較廣泛。基層圖書館有一批工作在流通、閱覽服務第一線的優秀館員,缺少的是能勝任網絡安全維護、圖書館管理系統維護、網站設計、程序開發、數字圖書館的建設、參考咨詢等技術性工作的人才,圖書館學本科教育應根據這些需要調整教學內容,使培養出來的人才能很快適應圖書館工作需要。
3.4建立一支既有圖書館工作經驗又有深厚理論基礎的專業師資隊伍,改進教學方法,激發學生的學習熱情和專業興趣
學校可以通過提高學歷水平,改善知識結構的辦法優化現有師資隊伍,還可以聘請圖書館資深館員、其他院系教師為兼職教師來增強師資隊伍,改善辦學條件。圖書館學是一門技術性很強的應用科學,比較注重學生動手能力的培養,靠單純的講授法是不能取得良好的教學效果的,教學時要注意靈活使用啟發式教學法、問題式教學法、社會實踐教學法、直觀教學法、多媒體教學法等多種教學法。[8]一般而言,開設圖書館學本科教育的學校,學校圖書館都建設得很好,圖書館各項工作都很出色,這是很好的教學資源,教學單位應該很好地利用這一得天獨厚的教學資源為學生課程實習創造良好的條件。也可以讓學生到學校圖書館去參加勤工儉學,讓他們熟悉圖書館各環節工作,提高對圖書館工作的感性認識,把所學理論知識與圖書館工作實踐很快結合起來,為走上工作崗位打下堅實的基礎。
[參考文獻]
[1]辛苗.中國圖書館學本科教育的危機[J].圖書與情報,2003(6).
[2]肖希明.圖書館學教育的根本出路在于教育體制的改革[J].大學圖書館學報,2004(1).
[3]李賀,李松玲.基于人才需求的“1+2”模塊式專業課程設置——現階段我國圖書館學本科教育課程體系改革之我見[J].圖書館建設,2006(3).
[4]吳鋼等.圖書館學本科教育的基礎地位不應動搖——關于圖書館學本科教育存在的問題的討論[J].圖書館學研究,2006(4).
[5]吳慰慈.中國圖書館學學教育的改革與發展(2)[J].圖書館工作與研究,2003(6).
[6]黃甫全.現代課程與教學論學程[M].北京:人民教育出版社,2006.
[關鍵詞]高校圖書館;大學生;人文素質
圖書館是人類文明的產物,是從事科學文化事業的社會實體。是開展社會教育的重要基地。教育部《普通高等學校圖書館規程(修訂)》總則第二條再次規定了圖書館在學校教育中的任務:“高等學校圖書館必須貫徹國家的教育方針,履行教育職能和信息服務職能,為培養德、智、體、美等全面發展的人才,發展教育科學文化事業,建設社會主義物質文明和精神文明服務。”明確了高校圖書館要對大學生進行品質塑造和擴大知識面的教育。可見,高校圖書館不僅是教學和科研的服務基地,更是大學生的第二課堂。它對大學生的教育是一種特殊的教育,在大學生人文素質教育中扮演著重要的角色。
1 人文素質與人文素質教育內涵
“人文素質指的是做人應具備的基本品質和態度,主要包括三個方面:一是具有豐富的人文科學知識,這是形素質的基礎,包括文、史、哲、藝術、科學技術史、倫理史等;二是對人類、民族命運的關注和責任意識;三是高尚的人格要素和健康的心理素質。”人文素質是人的諸多素質當中最根本、最基礎的素質,是人類發展中起基礎性作用的品質,對于人的其他素質的形成和發展具有很強的滲透力和影響力。“人文素質教育,就是將人類優秀的文化成果通過知識傳授,環境熏陶,使其內化為人格、氣質、修養,成為人的相對穩定的內在的品格。”_2J人文素質教育的目的,主要是引導學生如何做人,如何處理人與自然、人與社會、人與人的關系以及自身的理性、情感、意志等方面的問題。
2 大學生人文精神缺失分析與培養大學生人文素質的必要性
2.1 大學生人文精神缺失分析
近年來,由于就業壓力,高等教育存在著趨向于實用技術教育。“重科技輕人文”,“重知識傳授輕人格培養”,導致了我國大學教育中科學教育與人文教育嚴重不協調的弊端,使之呈現出“過弱的文化陶冶、過窄的專業教育、過重的功利導向”局面。商業主義對大學的入侵,大學的擴張,學生人數的劇增以及社會商業文化的泛濫使大學失去了象牙塔的氛圍。許多大學的教育僅是為了把學生塑造成滿足社會利益的有用工具,專門化、專業化、職業化已成為當今大學教育的主流,其結果造成高校學生人文素質的嚴重缺失。
2.2 培養大學生人文素質的必要性
大學生人文精神的缺失是當前大學教育必須面對的嚴峻現實,因此,加強大學生人文素質教育是培養新世紀人才的需要,也是培養大學生正確的世界觀、人生觀的需要。大學生作為具有較高科學研究、人文探索能力的高級人才,不僅是自然人、經濟人,更是文化人,他們理應熱情地關注人類社會的發展和命運。在對大學生實施素質教育時,不僅僅要引導他們認真學習,還須教育他們注重自己知識的合理結構,做一個“德、智、體、美、勞”全面發展的大學生。愛因斯坦曾經指出:“用專業知識教育人是不夠的,通過專業教育的人,他可能成為一種有用的機器,但是不能成為一個和諧發展的人。”也正是在這個意義上,我們說,現代教育呼喚一種能提高人的素質、陶冶人文精神的人文教育來與科學教育相互補充,我們必須用科學精神與人文精神的融合來緩解科技發展對人性造成的缺憾。
3 圖書館對大學生人文素質教育的優勢與作用
高校圖書館是學校重要信息源的發掘者、傳遞者、支撐力量和載體,可以說,它既是文化傳播的集散地,又是文化創新的策源地。因此,我們要十分重視高校圖書館文化氛圍的營造,充分發掘圖書館文化景觀,發揮其在人文教育中的獨特作用。
3.1 圖書館對大學生人文素質教育的優勢
3.1.1 具有豐富人文底蘊的館藏資源。“一個歷史意識、人文意識覺醒較早的民族必定也是圖書館意識覺醒較早的民族,這種圖書館意識不僅應當是一切從事圖書館工作的人的事業,也應當是每個有文化教養的人必不可少的文化意識。書籍的可貴在于書籍中所載的人的心靈探索、創構或升華的可貴,這一點是所謂圖書館意識或圖書館精神的意義所在。”高校圖書館凝聚著博大精深的文化精靈之氣,這座人文寶庫中記載了人類悠久的歷史,薈萃了中華民族古老而優秀的文化傳統和人文精神。保存著大量珍貴的文獻資源,這些古籍善本圖書、名人字畫及社會各界名人捐贈的資料等,具有較高的人文內涵和藝術欣賞價值的特藏珍品所獨具的人文魅力,往往會給大學生以內在的鼓舞和啟迪,對他們身心有意無意間產生深遠的影響。
3.1.2 具有“綠色”的人文環境。高校圖書館有著獨特的文化氣息和文明氛圍,它反映著學校的精神面貌,反映著校園文化品位和校園的人文景觀,體現著學校濃郁的書香特色。高雅、寧靜、舒暢的閱讀環境,能使學生自覺地受到教育。優化的人文環境,如館內條理清晰的規章制度,有序的借閱秩序等,對大學生形成一種約束力。館內名人格言與字畫點綴,工作人員熱情周到的服務,和諧的人際關系,濃厚的學習氛圍,再輔以人性化的管理措施,能使學生建立起自覺學習的意識,培養其形成良好的學風和積極向上的精神面貌。“綠色”的人文環境促使學生思考和感悟,形成一種積極健康的人格品質,從而提高精神品位,升華精神境界。
3.2 圖書館對大學生人文素質教育的作用
3.2.1 導向作用。引導大學生善于讀書、多讀書、讀好書,對大學生的人文教育至關重要。如高校圖書館中優美的文學作品能引導讀者走入詩情畫意般的境界,并逐步領悟其作品所蘊涵的情感藝術。閱讀人物傳記類作品,讀者在閱讀過程中不知不覺地被主人翁優良品質所感染,會在思想領域里與主人翁達成共鳴。為此,高校圖書館應密切關注大學生讀書傾向并及時加以引導。如我校圖書館對大學生在閱讀目的、內容、方法等方面給予直接指導和幫助:首先在文獻采集上調整購書比例,由原來醫學專業書籍占60%、人文社科類占40%的比例結構,調整為專業圖書占40%、人文社科類占60%;其次,選購中外歷史名著和現代名著、藝術鑒賞、名家書畫作品和有關勵志、禮儀、人際交往、人格教育、心理健康等類型書籍供大學生閱讀,并編寫“新書目”“推薦書目”“導讀專欄”等,通過校園網及板報專欄推薦給大學生。讓大學生通過閱讀吸收書中精華,使他們能夠開闊視野、凈化心靈、陶冶情操。
3.2.2 熏陶作用。高校圖書館是大學生繼承前人文化遺產,豐富完善自身精神文化修養乃至創造精神文化新成果的集聚場所,它具有強烈的文化輻射功能,這種特有的文化功能,使圖書館成為提高大學生人文素質的重要場所。環境的熏陶是無言的教育,潛在的影響,大學生身處圖書館的文化氛圍里,在潛移默化中接受文化氣息的熏陶,并可通過藝術作品給大學生以力量和啟迪,如我校將圖書館與藝術館融合在一起,使圖書館既有豐富人文內涵的文獻資源,又具有觀賞性很強的立體藝術作品。現有的466件藝術藏品,為我校大學生提供了人文精神食糧。藝術館為大學生提供直接參與藝術活動的機會,使大學生們“通過藝術活動,受到真、善、美的熏陶和感染,而潛移默化地引起思想感情、人生態度、價值觀念等的深刻變化。”
以下提供一些廣東省新聞出版局特別提示的非法刊物,希望對各位有需要的人有所幫助。
如何判斷一個刊物為是否是正規刊物?
以下是廣東省新聞出版局特別提示的非法刊物:
《中國教育研究與實踐》
《全國教育優秀論文摘》
《中國教育教學研究雜》
《教育科技探索與實踐》
《中國現代教育論壇》
《中國教育(高教版)》
《中國新教育》 《亞洲教育》
《當代教育科研》
《教育新發展》 《當代教師》
《中國教育改革與研究》
《中國當代教育研究》
《中國科學教育研究雜志》
《教育新導向》
《中國當代教育雜志》
《當代素質教育》
《教育管理與科研》
《教學理論與方法》
《中華素質教育雜志》
《中華創新教育》
《教育理論研究與實踐》
《中國教育理論雜志》
《中國教育研究》
《當代南方教育論壇》
《中國教育與經濟論》壇》
《中國現代教育研究》
《中國教育改革與研究雜志》《中國教育縱橫雜志》
《中國創新教育》
《當代教育》 《教育縱橫》
《中國教育家雜志》
《中華百年教育》《今日教育》
《中國教育與教學雜志》
《中國教育教學雜志》
《中華教育教學實踐與研究雜志》
《中國教學縱橫雜志》
《中國現代教育教學雜志》
《中華現代全科》
《中國人文科學研究》
《中國研究生雜志》
關鍵詞:組織內容; 內容安全; 風險識別方法; Web挖掘技術
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2016)11-0021-02
互聯網上的文本內容中,一部分信息和內容對組織以及個人具有積極的影響,而另一部分則會造成消極的影響。例如,某人通過淘寶網購買了一件商品,但是他認為該商品質量存在問題,于是他在商品的評價中發表了自己的觀點,當認同此評價的個體越來越多的時候,該評價就演變成了熱門評價,既而可能會引發個體對該商品的嘲諷、謾罵,最終對商品的銷售產生無形的影響。在這種情況下,組織如何去識別可能發生的風險?如何去評價風險發生之后造成的影響?又如何去降低對資產所造成的損失?
“內容安全”是其中的一個核心問題。內容安全是指由信息內容所引發的信息安全事件以及由此所造成的損失。能夠引發內容安全事件的風險即是信息內容風險。因為信息內容安全事件等相關概念不適用于社會組織,現對相關概念進行擴充,具體如下:“組織內容”是指在互聯網上傳播的信息中與組織相關的內容,以及個人或其他組織針對這些信息所持有的態度。“組織內容風險”是指與組織相關的內容可以為個人或者其他組織所利用,在利用過程中對組織的無形資產造成損失的可能性。1
本文主要研究組織內容風險的識別方法。第一部分為引言,第二部分描述了國內外有關信息內容安全的發展現狀,第三部分介紹了組織內容風險識別方法體系,第四部分主要討論了內容分析法,第五部分詳細說明了網絡計量法,第六部分對本文介紹的識別方法進行了問題分析并提出了改進方向,第七部分運用分析工具對廣西師范學院的官方網站進行了外鏈分析,第八部分比較了不同類型組織的風險差異性,最后對本文的研究內容作了總結。
1組織內容風險識別常用分析方法體系
上文中提到,內容安全是由信息內容所引發的信息安全事件,那么對信息內容的分析可以參考情報分析的理念和方法,以及自然語言處理、數據挖掘、人工智能等技術,從而形成一套組織內容風險識別分析方法體系,如下圖1所示:
1.1鏈接分析法
鏈接分析法是根據網站與網站之間的相關性來進行操作的,無論何種網站都是由許許多多的網頁組成,而這些網頁彼此之間存在著某種關系,這種相關性是指:1)內容相關性。網絡信息從某個方面來講是聚合的;2)結構相關性。網頁與網頁之間以某種結構相互關聯;3)功能相關性。站點可以通過它和其他站點之間共享內容;4)附屬相關性。網站的主體是內容、結構和功能,而相對于這些主體部分,網站上的廣告、網站上的友情鏈接以及初次之外的其他鏈接等都暫且歸為附屬相關性。
網頁中存在著大量動態的超鏈接,它是網頁的重要元素,幾乎所有的網頁都是利用超鏈接來建立相互之間的聯系。超鏈接一方面便于引導用戶瀏覽網頁;另一方面,網頁鏈接的創建都帶有一定的目的性,既超鏈接時常會指向它們認為想要網站訪問者看到的網頁,因此這些超鏈接隱含了大量人為設定的目的信息。所以,對互聯網的鏈接結構信息進行充分挖掘,將對改善Web信息檢索準確度、Web隱式社區的發現等方面產生極為重要的意義。
1.2文本挖掘法
文本挖掘主要由以下步驟構成:
(1)文本預處理:將文本對象轉換成文本挖掘工具能夠識別的格式。一般包括兩個主要步驟,既特征抽取和特征選擇。
(2)文本挖掘:是指采用數據挖掘以及模式識別等方法獲取面向特定應用目標的知識和模式。
(3)模式評估和表示:利用已確定的評估標準進行評估。
1.3主題聚類法
主題發現也叫主題抽取或者主題識別,其作用是處理和分析大規模信息同時使用戶以最迅速有效的方式理解信息內容,探究信息中的主題。當前對于主題發現并沒有一個明確定義,只是將從復雜大規模信息源中獲取主題并進行表現的一系列技術方法統稱為主題發現。通過精讀一系列相關項目和論文,筆者認為,主題發現可作廣義和狹義兩種解釋。
廣義的主題發現方式較為靈活,只要是可以發現代表性信息的方法都可以歸納為廣義的主題發現。比如,針對文本的主題發現有:從高頻被引論文中提取高頻詞來代表主題領域、基于語義局部性思想來判定主題領域等多種方式。
狹義的主題發現是指從文本中提取關鍵文字信息,將主題聚焦在某幾個詞上的方法。此種方法需要發現文檔中的關鍵問題,聚焦關鍵詞并選取適當方式呈現,其也是目前主流的主題發現方法研究模式。本文的主題聚類法主要基于此種定義。
主題發現的目標在于運用一系列語義理解方式,從文本中自動提取關鍵詞或術語,然后在此基礎上加以聚類,從而發現主題,并以恰當的方式呈現出來,該方法的關鍵作用在于利用語料自身的組織和結構來發現語義信息。聚類方法還有另一優勢,傳統方式是利用基于詞的匹配來發現語料中的信息,其沒有考慮到語料自身的結構在理解語料時會發揮的作用。所以,更準確地說,主題發現并不是某一項特定的技術,而是很多方面技術的綜合運用。
2 鏈接挖掘工具應用及分析實例
目前,國內外有為數眾多的免費鏈接分析工具。本文選取國內一款名為“站長工具”的外鏈查詢工具進行實例分析。該軟件是一款Web頁面工具,其界面如下圖所示:
該工具有三個文本框,第一個填寫分析的域名對象,然后點擊右側“查詢”按鈕即可得出所需結果;后兩個為附加項,可在查詢的同時輸入需要的外鏈文本或過濾不需要的域名,亦可對文本進行模糊匹配查詢。
現使用該工具對廣西師范學院官網進行鏈接分析,復制廣西師范學院官網域名,粘貼到“請輸入查詢的域名”后面的對話框中,得到分析結果如下:
由圖中可以看出,本域名有反鏈數74個,子域名數3個;點擊“子域名”右側展開按鈕,可查看結果中的3個子域名,如下圖:
每個子域名后面中括號內的數字顯示了其反鏈數。該工具的排序方式有權重、PR、反鏈數三種;“只顯示nofollow”為附加條件,可選擇查看是否帶nofollow的域名。網頁主體內容顯示了本域名所有的反鏈;每條反鏈下方的信息從左到右分別表示:該反鏈的域名、本域名在該反鏈中的權重、該反鏈的反鏈數、鏈接名稱、是否帶nofollow。
通過本工具,我們可以得出的信息如下:
a.本域名有74個反鏈,3個子域名及其完整域名。
b.所有反鏈的域名、反鏈自身的反鏈數以及該反鏈是否帶nofollow。
c.本域名在各個反鏈頁面中的鏈接名稱。
d.在本域名的所有反鏈中,網頁“廣西師范學院_廣西師范學院錄取分數線,專業介紹,圖片_新浪院校庫_新浪教育”中所占的百度權重最高,下表為百度權重各指數域名數量:
e.在本域名的所有反鏈中,網頁“廣西師范學院_廣西師范學院錄取分數線,專業介紹,圖片_新浪院校庫_新浪教育”的PR(PageRank)值最高,PR值越高說明該網頁在google搜索中越重要,下表為PR值各指數域名數量:
f.在本域名的所有反鏈中,網頁“123網址之家-教育大學 教育網_中國教育網_教育部_教育論文_遠程教育_成人教育_教案_教育培訓”所擁有的反鏈數最多,約為1682個,下表為各反鏈數區間的域名數量:
[反鏈數區間\&2000~1501\&1500~1001\&1000~501\&500~1\&0\&域名數量\&2\&0\&1\&41\&29\&]
鏈接分析是組織內容風險識別的重要組成部分,在本次分析的基礎上,可進一步分析其鏈接類型和鏈接動機,以便為組織內容風險識別提供基礎。
3 結論
本文就組織內容安全風險識別對已有方法進行研究綜述,列舉了兩種常用的方法和三種基于Web挖掘的法,并對列舉的方法進行了詳細的闡述,同時分析了各風險識別方法的不足,并給出各個方法的可能改進方向以及新的研究方向,為組織內容風險識別提供理論與技術支持。
參考文獻:
[1] 中國信息安全測評中心.組織內容風險模型[C].2013.
[2] 揚益凡,朱明等.基于鏈接相似度Web挖掘算法的研究與改進[J].計算機應用與軟件,2011.
[3] 揚中華,汪勇.程序員技能需求:基于內容分析法的分析[J].現代情報,2007.
[4] 王知津,閆永君.網絡計量法與內容分析法比較研究[J].圖書館學研究,2006.
[5] 沙新光.基于主題的聚類檢索技術研究[D].哈爾濱工業大學,2008.
[6] 丁寶瓊.網絡文本信息采集分析關鍵技術研究與實現[D].信息工程大學,2009.
[7]Edna Reid,Marc Sageman.The Dark Web Portal Project:Collecting and Analyzing the Presence of Terrorist Groups on the Web:Intelligence and Security Informatics[M].Springer,Berlin,2005.
[8]Deerweter S,Dunmaisst,Fumasgw.Indexing by latent semantic analysis[J].Journal of the American Society for Information Science,1990(6):391-407.