美章網 資料文庫 檔案社會化媒體現狀及信息整合范文

    檔案社會化媒體現狀及信息整合范文

    本站小編為你精心準備了檔案社會化媒體現狀及信息整合參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

    檔案社會化媒體現狀及信息整合

    一、檔案社會化媒體研究的現狀及方法

    1.研究檔案社會化媒體的現狀進展關于檔案社會化媒體的研究,一些學者在闡釋休閑利用觀的基礎上介紹了國外檔案利用服務社會化的理論研究和實踐情況,在設計檔案社會化媒體信息資源整合的基本框架時對檔案社會化媒體研究進行了初步探討,在業務層面討論了網絡環境下影響我國檔案利用的行為因素,從“用”和“管”的角度對國內外幾個主流社交媒體相關研究文獻的研究情況進行了綜述分析。近年來,檔案社會化媒體成為一個新興的、快速發展的研究應用領域。作為交叉研究領域,檔案社會化媒體研究一方面受到學界的爭議,另一方面也受到研究成果少、理論基礎薄弱、研究人員缺乏、相關技術手段不足等多方面的限制。社會化媒體與檔案學的結合,一方面給社會化媒體的發展拓寬了渠道,另一方面為檔案事業的發展注入了新的活力。為掌握國內檔案社會化媒體研究現狀及發展趨勢,需要利用軟件工具對學術期刊數據庫和新媒體資源中的相關資料進行數據采集分析,以期為深入研究檔案社會化媒體構建“大數據”,也為該研究領域的進一步發展提供參考借鑒。

    2.研究檔案社會化媒體的方法步驟針對國內相關檔案社會化媒體的期刊文獻進行分析,以期有一個較為全面的把握。研究主要利用了Citespace、Ucinet、Bicomb2、SPSS22和Excel等軟件工具,對2007年以后的國內檔案社會化媒體領域464篇期刊論文進行分析。方法步驟概述如下:(1)通過專業檢索式檢索相關期刊文獻,并通過CNKI自帶導出功能,選擇refworks及endnote2種方式,將經過人工篩選的樣本論文題名、作者、關鍵詞等數據導出為文本文件格式保存;(2)通過書目共現分析系統Bicomb2軟件對所需數據進行提取統計,并以Excel格式進行保存,運用Citespace等工具對數據進行多方面分析探討;(3)通過Bicomb2構建共詞矩陣,借助Ucinet繪制關鍵詞知識圖譜,并將共現矩陣轉換成二值矩陣,進行k-核分析;(4)基于ochiia系數將共詞矩陣轉換為相異矩陣,將相異矩陣導入SPSS22進行聚類分析,并對核心—邊緣關鍵詞進行標注;(5)根據分析結果,聚焦出國內檔案社會化媒體領域的研究熱點;(6)基于戰略坐標理論對熱點主題進行分析。

    3.研究檔案社會化媒體的數據來源鑒于中國知網具有較高的權威性和數據可靠性,而且期刊文獻更新速度較快,能夠較好地反映一個領域的最新研究成果及發展趨勢,因而選擇中國學術期刊網絡出版總庫為樣本數據來源,檢索時間為2018年1月12日,基本檢索式構成為:SU=(社會化媒體+社交媒體+微博+博客+微信+社交網站+新媒體+自媒體+web2.0+web3.0+webarchive+網頁歸檔)*(檔案+檔案信息+檔案工作)。為保證有較高檢準率和檢全率,又在該基本檢索式上構建了多條輔助檢索式。經過多次試驗,選擇得到667條記錄,經過人工篩選,對結果進行去重、刪除無效條目,最終得到464篇相關文獻作為樣本。對發文量進行處理生成發文量趨勢圖,表明近10年有關檔案社會化媒體的文獻總體呈現緩慢增長的趨勢,是社會化媒體引入檔案領域的初始階段。其中,一些論文介紹了Web2.0的概念、特點及主要應用,介紹了借鑒先進思想理念拓展檔案信息服務的方法,介紹了美國網絡歸檔項目及進展情況,這是國內較早把社會化媒體引入檔案研究的文獻。分析還發現,發文量10年里從12篇上升到133篇,呈“J”形增長趨勢,表明這一研究領域已經進入到一個發展上升期,可以推測今后幾年里,檔案社會化媒體領域的研究仍然是一個研究熱點。

    二、檔案社會化媒體文獻要素的知識圖譜分析

    1.作者群及活躍作者信息的知識圖譜課題組對文獻機構—作者的聚類進行圖譜分析,圖譜中用節點大小反映研究機構研究成果的數量,用顏色反映研究的活躍程度。結果是:目前檔案社會化媒體領域的活躍研究團隊主要有以中國人民大學、上海大學為中心的研究團隊,以南京大學和西北大學、安徽大學為主的研究團隊,其他的活躍研究機構包括原南京政治學院、山東大學、河北大學、遼寧大學、四川大學、南陽醫高專科、鄭州大學和鄭州航空工業大學等。從以上活躍的研究團隊和研究機構可以看出,各研究機構之間合作比較頻繁,突破了地緣限制。隨著互聯網信息技術和社會化媒體的發展,跨地域合作得到了增強,而這種跨地域合作也是科研領域中非常重要的推動力量。活躍的研究團體和機構關鍵資源在于擁有一批活躍的研究人員,通過對研究者進行分析,有助于了解該領域的主要研究人員及其分布情況。課題組根據普萊斯定律,將計算得出發文3篇及以上的作者定為核心作者,統計得到核心作者共20位,發文量達9篇排名第一的作者為“黃霄羽”。從研究人員發文情況看,雖然年發文量呈現發展上升趨勢,但是核心研究人員研究成果并不多,尤其是獨立研究成果比較少,只有39篇,占比為8.4%,應與檔案社會化媒體這一新興研究領域的發展階段有關。另外,464篇文獻共分布在109種期刊上,發文量最高的期刊主要屬于檔案類。109種期刊中核心學術期刊占比為19.23%,所刊載的文獻量占比為61.4%。表明檔案社會化媒體研究領域受到學界的較大關注,尤其是檔案學界對該領域給予了較高的重視。因此,可以推斷該研究領域總體發展趨勢向好。

    2.關鍵詞及其聚類信息的知識圖譜關鍵詞能較為準確地反映文獻的研究主題,通過對關鍵詞進行分析,能夠挖掘出該研究領域的熱點問題,并有助于預測未來的研究方向。課題組對464篇文獻進行關鍵詞統計,共得到1251個關鍵詞。合并和去除相近或無實際意義的詞匯,根據關鍵詞出現的頻次,選取詞頻≥5的關鍵詞集作為分析對象。對這些高頻關鍵詞進行兩兩統計,生成一個關鍵詞共現矩陣,將矩陣導入到Ucinet6.2中,計算節點的點度中心性,并基于點度中心性的大小對關鍵詞進行顯示,得到關鍵詞知識圖譜圖:圖譜中節點大小與關鍵詞度數成正比,節點越大表明關鍵詞中心性越大(即關鍵詞詞頻越高),反之表明關鍵詞中心性越小(即關鍵詞詞頻越低);圖譜中連線的粗細反映的是關鍵詞相互之間關聯度的大小,連線越粗表明關鍵詞之間關聯度越大(即關鍵詞之間共現頻率越高),反之表明關鍵詞之間關聯度越小(即關鍵詞之間共現頻率越低)。在原始共現矩陣中非零元素的平均值經過計算約為2.97,共現頻次設定為2,利用Ucinet6.2將關鍵詞共詞矩陣轉換成二值矩陣,以便確定核心關鍵詞和邊緣關鍵詞。為消除詞頻差距造成的影響以及相關矩陣中0值對分析結果的干擾,用ochiia系數將共詞矩陣轉換成相似矩陣,再用1減去相異矩陣中的數據后得到關鍵詞相異矩陣。相異矩陣中的數值反映了關鍵詞兩兩之間的距離,數值越大表明關鍵詞之間的相似度越小,反之則關鍵詞之間的相似度越大。

    三、檔案新型資源整合的知識圖譜研究

    1.檔案社會化媒體信息資源的元數據映射標準化建設是檔案新型資源有效整合的前提。只有加快檔案信息化標準體系建設,才能避免各單位各自為政、盲目建設和“信息孤島”等現象,保障檔案信息資源的有序建設和有效整合。檔案信息化建設中的標準制訂應該有組織有計劃地進行,加強檔案界與信息產業界以及特定行業的合作,兼顧與國際標準和通用規范的銜接,注重前瞻性、操作性和導向性,從管理、業務和技術等層面上形成一個科學、配套、適用的標準體系。檔案社會化媒體研究尚處于發展上升階段,基于本課題的研究任務,有必要進一步揭示以檔案學為代表的信息管理學科中信息服務關注的知識關聯,探索大數據下檔案社會化媒體學術資源搜索的可視化應用,最終將檔案館微博、檔案信息網、政務網及微信公眾號等統一納入數據采集范圍,以實現真正意義上的互聯網檔案學科相關信息的整合,提供檔案知識服務。不同社會化媒體平臺的不同網頁在結構布局方面存在差異,大體上具備與DC核心元素中的大部分元素相對應的標簽項,根據這些標簽項能夠實現對不同網頁元數據信息的結構化抽取。以論壇、博客和微博的網頁信息為例,這些標簽項與DC元素之間一般遵循如下映射關系:DC元素名稱:=<論壇元數據>+<博客元數據>+<微博元數據>+<微信元數據>+……。如,Subject:=[帖子關鍵詞]+[博文標簽]+[#話題#];Relation:=[相關分類帖子]+[相關鏈接]+[@(被提及用戶)]。通過上述的知識組織,可以對論壇、博客、微博、微信的元數據元素與DC元數據元素進行映射設計,從而間接實現了各社會化媒體信息資源的元數據之間映射。

    2.檔案新型資源整合中信息搜索的知識圖譜應用拓展檔案信息整合輻射面,能夠豐富檔案資源的內涵。檔案新型資源整合的重要目的,是要通過對多載體、多門類檔案信息的聚集,形成內涵豐富的檔案大資源庫,實現檔案社會化媒體信息的統籌管理和共享服務。檔案新型資源的整合同樣是以對檔案社會化媒體信息搜索為基礎的。檔案新型資源搜索的結果排序有以下2個因素:通過屬性計算得出搜索詞相關度的影響力,通過與其他對象之間關系計算得出搜索對象的影響力。在檔案社會化媒體資源搜索中,知識圖譜技術可以提供文件關系與知識導引:一是通過文件內容相關性的比較,展示相關文件在不同全宗、案卷、發文機構、所屬分類之間的聯系;二是通過主題詞之間的相關性,展現文件間的關系;三是通過引用與被引用文件間的關系,幫助、引導用戶快速獲取知識;四是通過直接顯示在用戶界面與用戶輸入時智能提示的方法,將用戶輸入的查詢關鍵詞相關、相似的詞匯提供給用戶。運用知識圖譜技術對檔案社會化媒體文獻進行搜索分析,結果表明:(1)檔案社會化媒體領域正處于發展上升階段,相關理論還需成熟;(2)檔案社會化媒體已具備較好的科研資源并受到學界較高的關注,目前已形成多項熱點,其中社會化媒體環境下的檔案價值研究、社會化媒體環境下的檔案信息服務有較強的發展潛力;(3)如何對新型檔案信息進行有效整合、集成,形成便于開發、易于共享的服務資源,是檔案學界關注和努力解決的重大課題。

    3.檔案新型資源整合中信息服務的知識圖譜應用檔案新型資源整合的目的之一,就是能夠開展高質量的檔案社會化媒體信息服務。基于知識圖譜工具選取檔案新型資源,以其中的關鍵詞為研究對象構建關鍵詞共現矩陣。可以運用知識圖譜直觀地反映發文數量、發文比例及組織機構研究的趨勢;可以利用詞頻指數確定高頻關鍵詞的限值,利用共詞聚類方法獲取檔案研究知識群;可以基于關鍵詞共現矩陣通過社會網絡分析的節點中心性分析,獲取檔案信息網絡中處在核心位置并具控制力的關鍵詞;可以運用知識圖譜軟件直觀、形象地呈現網絡內隱含的知識關系,以推進檔案新型資源的信息分析和知識服務。當前,檔案界的研究對象已經不再是單一的文獻信息,而是更多地集中在檔案網絡資源的發掘上。搜索數據的知識圖譜已在產生、收集和傳遞信息方面大大減少了人力投入并縮短時間,而且在分析和解釋上能充當更重要的角色。在檔案信息整合中,注重擴展文件收集的范圍,凡是反映地方特色、具有典型意義和具有代表性的網上檔案信息內容,都應力爭納入檔案館收集范圍,作為檔案信息資源整合的重要內容。然后,通過開發統一的數字檔案管理系統,集中采集新型檔案資源信息,以拓展檔案信息資源整合的范圍和輻射面。下一步,課題組將繼續探索大數據下檔案社會化媒體資源的知識圖譜的具體應用。如根據研究方向數據成像作出正確、有效和有依據的決定,通過檔案信息的多元化組織展示,將無序復雜的數據轉化為更易用的形式,從而實現檔案資源搜索的決策高效和信息準確。總之,促進檔案網上社會化媒體信息的交流共享和研究利用,已成為當前深度開發檔案新型資源和創新檔案信息服務的發展趨勢,檔案社會化媒體數據的知識圖譜應用是我國檔案新型資源整合服務發展的必然趨勢。

    作者:王蘭成;黃永勤;余遵成

    主站蜘蛛池模板: 亚洲av无码天堂一区二区三区 | 精品国产一区二区三区AV| 福利片免费一区二区三区| 中文字幕日韩一区二区不卡| 91精品国产一区| 久久精品无码一区二区三区不卡| 天堂一区人妻无码| 理论亚洲区美一区二区三区| 国产精品一区二区电影| 一区二区三区在线播放| 中文字幕乱码一区二区免费| 无码国产精成人午夜视频一区二区| 美女毛片一区二区三区四区| 日韩高清一区二区| 国产一区二区三区免费观在线| 亚洲无线码一区二区三区| 精品无码人妻一区二区免费蜜桃 | 一本一道波多野结衣一区| 国产麻豆精品一区二区三区| 一区二区三区在线播放视频| 台湾无码一区二区| 日美欧韩一区二去三区| 国产一区二区三区在线影院| 少妇无码一区二区二三区| 亚洲中文字幕在线无码一区二区| 国语对白一区二区三区| 国产在线精品一区免费香蕉 | 色妞色视频一区二区三区四区| 交换国产精品视频一区| 亚洲av无码一区二区三区不卡| 成人毛片无码一区二区| 中文字幕在线观看一区二区 | 久久精品国产一区二区电影| 亚洲一区在线视频观看| 天码av无码一区二区三区四区 | 国产成人精品日本亚洲专一区 | 亚洲色婷婷一区二区三区| 九九无码人妻一区二区三区| 国偷自产一区二区免费视频| 精品国产亚洲第一区二区三区| 一区二区三区视频在线|