美章網(wǎng) 資料文庫 大眾分類法的網(wǎng)絡文學標簽應用研究范文

    大眾分類法的網(wǎng)絡文學標簽應用研究范文

    本站小編為你精心準備了大眾分類法的網(wǎng)絡文學標簽應用研究參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

    大眾分類法的網(wǎng)絡文學標簽應用研究

    摘要:以用戶自定義標簽為主要形式的大眾分類法網(wǎng)絡文學領域得到了普遍應用,標簽分類對網(wǎng)站原有的標準化分類系統(tǒng)進行了補充和完善。但不同的網(wǎng)絡文學網(wǎng)站在標簽的數(shù)量、類型、詞長詞性、重合度方面具有較大差異,網(wǎng)絡文學標簽在規(guī)范性上也存在通用程度低、同義詞和近義詞泛濫、歧義泛意指代模糊等問題,需要借助技術手段和運營手段實現(xiàn)對標簽的規(guī)范控制。

    關鍵詞:網(wǎng)絡文學;大眾分類法;規(guī)范控制

    網(wǎng)絡文學是一種以網(wǎng)絡為載體和媒介實現(xiàn)創(chuàng)作、傳播、閱讀的過程的文學形式,廣義上泛指一切首發(fā)于網(wǎng)絡平臺的原創(chuàng)文學作品,狹義則指專門性文學網(wǎng)站上發(fā)表的通俗小說。本文涉及的“網(wǎng)絡文學”概念為狹義的網(wǎng)絡文學。由于網(wǎng)絡文學具有變化快、存量大、信息專業(yè)化程度低、無序性強的特點,且兼網(wǎng)絡文學的讀者閱讀需求分散、概括及表達能力參差不齊,傳統(tǒng)的自上而下層級式圖書分類方法既無法滿足網(wǎng)絡文學作品分類細化的需求,也不能幫助讀者提高信息檢索效率,反之,由用戶自發(fā)定義標簽對內(nèi)容信息進行描述并實現(xiàn)自動分類的平行非層級分類方法,即大眾分類法,在網(wǎng)絡文學領域得到了普遍應用,“標簽”也成為了讀者在網(wǎng)絡文學網(wǎng)站對作品內(nèi)容進行檢索時的重要依據(jù)。

    1網(wǎng)絡文學網(wǎng)站大眾分類法及標簽應用機制

    1.1大眾分類法相關概念2004年美國學者ThomasVanderWal首次提出大眾分類法(Folksonomy)的概念①,表示大眾分類法是廣大用戶根據(jù)自己需求和理解為信息自由添加標簽(Tag),從而實現(xiàn)信息分類的方法。標簽的選擇完全取決于用戶的習慣和目的,所添加的標簽不僅服務于添加者本人,還被廣泛共享于整個站點或網(wǎng)絡。相比主題詞和關鍵詞的使用規(guī)范,標簽在使用時通常并不要求全面概括或高度提煉信息內(nèi)涵,而且標簽詞匯在專業(yè)性上沒有要求,因此具有突出的自由性、簡易性、開放性的特點。此外,標簽之間不存在層級關系,不強調(diào)唯一性,能很好地實現(xiàn)信息的細化分類,從而以較低的管理成本換取了較高的使用價值。然而,也正是由于自由度高、缺乏規(guī)范化管理,用戶自定義的標簽詞匯也存在詞量過大、語言混亂等問題。因此,應用大眾分類法的網(wǎng)站通常會利用“反長尾理論”會對用戶添加的標簽進行聚類整理,選擇高頻標簽和標簽分類結果呈現(xiàn)在檢索界面或推薦界面,以供用戶選擇,一定程度上實現(xiàn)對標簽詞量的控制。

    1.2網(wǎng)絡文學網(wǎng)站標簽使用流程網(wǎng)絡文學具備存量大、更新快、題材體裁繁雜、受眾需求分散且文化素養(yǎng)偏低等特點,十分適用大眾分類法。目前,國內(nèi)影響力較大的原創(chuàng)文學網(wǎng)站大部分已采取大眾分類法對內(nèi)容資源進行細化分類。在創(chuàng)作階段,網(wǎng)站會要求注冊的作者為作品添加適當數(shù)量內(nèi)容描述性標簽,此類標簽可以在熱點標簽中進行選擇,也可以自行編輯定義。一般而言,網(wǎng)站對單篇作品標簽數(shù)量規(guī)定的上限為3~4個,除此之外,不對標簽詞性、字數(shù)做要求。在作品發(fā)表及閱讀階段,部分網(wǎng)站允許讀者用戶添加收藏標簽或構建書單標簽。當同一標簽共現(xiàn)次數(shù)達到一定標準,系統(tǒng)則會將其提取為熱門高頻標簽,出現(xiàn)在作品檢索頁面或首頁推薦板塊,并成為作者創(chuàng)作時的備選標簽。當共現(xiàn)次數(shù)進一步提高,該標簽甚至可能會被網(wǎng)站編輯所關注,經(jīng)過規(guī)范化處理后提煉為基礎分類中的固定選項。

    1.3自定義標簽分類與標準化分類的主要區(qū)別編輯主導的標準化分類是各大文學網(wǎng)站的基礎分類體系,該分類與用戶主導的標簽分類體系體現(xiàn)在5個方面:1)所有類目的標引詞均經(jīng)過編輯的規(guī)范整合,具有較高的準確性,并在語法上保持統(tǒng)一;2)通常情況下,基礎分類選項具有唯一性,不可多選、復選;3)通常情況下為強制性分類,作品上傳前必須加以選擇,無法跳過該分類環(huán)節(jié);4)基礎分類主要依據(jù)作品大綱,對作品的主干內(nèi)容進行分類,一般不涉及小說細節(jié);5)基礎分類在結構上更為清晰,具有層級結構。

    2網(wǎng)絡文學網(wǎng)站高頻標簽比較分析

    本次研究統(tǒng)計了起點中文網(wǎng)、起點女生網(wǎng)、晉江文學城、17k小說網(wǎng)、瀟湘書院、縱橫中文網(wǎng)在內(nèi)的6家文學網(wǎng)站、共計7個站點(17k小說網(wǎng)分為主站、女頻小說站兩個站點)的標簽。選擇這6家網(wǎng)站作為研究對象的原因是其日均流量、百度指數(shù)處于同類網(wǎng)站中的領先地位,并且兼顧男頻女頻兩大小說類型,具有代表性。

    2.1標簽數(shù)量比較從標簽數(shù)量上看,共收集標簽553個(不排除重復標簽),平均每個站點標簽數(shù)為79個,其中瀟湘書院和晉江文學城標簽數(shù)量最多,分別為183、119,數(shù)量最少的站點為縱橫中文網(wǎng),只設定有29個備選標簽,各網(wǎng)站之間備選標簽數(shù)量之間存在較大差距。

    2.2標簽類型比較對網(wǎng)絡文學網(wǎng)站熱門標簽依據(jù)標簽描述對象分類,一般可以分為“角色、情節(jié)、風格”3大類。不同網(wǎng)站由于自身讀者群體和整體風格不同,在標簽類型上存在不同傾向。如晉江文學城119個熱門標簽中僅3個與角色有關,其他絕大多數(shù)為情節(jié)類標簽,而起點中文網(wǎng)74個熱門標簽中則有28個為角色類標簽,占全部熱門標簽的30%以上。

    2.3標簽詞長與詞性比較7個站點的熱門標簽除極少數(shù)英文詞匯外,其余詞長均為2至4個漢字字符,詞性方面則比較混亂,包括了名詞、形容詞和動詞。少數(shù)網(wǎng)站對篩選出來的熱門標簽的詞長和詞性進行了統(tǒng)一,如瀟湘書院,全部59個熱門標簽,詞長均為2個字符,詞性方面均為名詞,相對規(guī)范。其余網(wǎng)站,則沒有做到完全統(tǒng)一,但具有一定的傾向,如晉江文學城的標簽字符數(shù)較多,常見為4個字符,且多為文學性較強的成語或詞組,如“情有獨鐘”“花季雨季”“天之驕子”等,相對應的其他站點的近義標簽則為較為簡單的“專情”“青春”“精英”。

    2.4各網(wǎng)站之間標簽重合度比較從標簽重合度上看,7個站點間重復標簽共有112個,一定程度上體現(xiàn)了網(wǎng)絡文學標簽共通性,然而,其中出現(xiàn)概率在50%以上(即出現(xiàn)3次以上)的標簽僅有16個,此外,核心內(nèi)涵一致的標簽,在不同站點或同一站點內(nèi)具體表述形式上存在差異,大量詞匯在詞義上存在層級關系和關聯(lián)關系,體現(xiàn)了標簽設置的隨意性和用戶標注習慣的差異性。

    3網(wǎng)絡文學標簽存在的規(guī)范性問題

    在大眾分類法倡導由用戶自由構建標簽,這使得個體差異在標簽構造、傳播和使用的過程中體現(xiàn)得尤為明顯,未經(jīng)過專業(yè)訓練的大眾,在設置標簽時對資源描述的準確性有所欠缺,導致標簽規(guī)范性問題在所有應用平臺上普遍存在。而在網(wǎng)絡文學領域,由于內(nèi)容更新快、熱點交替頻繁、題材繁雜、讀者關注點分散,資源描述的難度進一步增加,規(guī)范性問題也隨之更為突出,具體表現(xiàn)為以下幾個方面。1)各網(wǎng)站之間標簽通用程度低。雖然同屬網(wǎng)絡文學原創(chuàng)網(wǎng)站,但各網(wǎng)站因其受眾和風格差異,用戶設置及網(wǎng)站提取的標簽,在數(shù)量、細化程度、描述側重點、語法結構、詞義詞性、具體表述形式上都存在不同。同一標簽,在不同網(wǎng)站的使用幾率不一;同一概念,在不同網(wǎng)站標簽的字面表述形式也存在或大或小的差異。例如,在男性向小說網(wǎng)站情感類文章較少,只需“感情”標簽即可滿足大部分男頻言情小說的分類需要,而在女性頻道,與“感情”相關標簽則需要細化為“虐戀情深”“都市情緣”“西方羅曼”等不同維度;大部分男頻網(wǎng)站的標簽傾向于簡單明了的概念和詞匯,相比之下女頻網(wǎng)站標簽文學氣息、浪漫氣息更濃,同時也更為復雜。2)大量同義詞、近義詞和關聯(lián)詞造成冗余。用戶在最初對網(wǎng)絡文學作品進行標注時采取的規(guī)則并不統(tǒng)一,導致出現(xiàn)大量同義詞、近義詞及關聯(lián)詞詞義交叉的問題。主要表現(xiàn)有兩類,一類在語義和語法上都近似,只存在微小字面差別,如“洪荒”與“洪荒流”“種田”與“種田文”;一類則是缺少字面聯(lián)系,但存在密切的內(nèi)在關聯(lián),如“吸血鬼”與“血族”“咸魚翻身”與“炮灰逆襲”“鑒寶”與“古玩”。后者比前者更為隱蔽,但造成的冗余現(xiàn)象以及在檢索時對查全率查準率的影響卻不低于前者。3)歧義、泛意化、復合式詞匯干擾分類。除同義詞、近義詞外,歧義、泛意化以及復合式的標簽詞匯,也對標簽分類的使用效率造成了極大的干擾。歧義的出現(xiàn)主要是由于網(wǎng)絡文學中的部分概念具有特殊性。例如,網(wǎng)絡文學網(wǎng)站中“獵人”標簽通常指代某日本動漫作品,一般用以描述以此動漫作品為創(chuàng)作背景的同人小說,但如果主要角色類型為“打獵者”的小說也可能使用“獵人”標簽。泛意化詞匯是指如“風云”“傳奇”等含義寬泛、指代模糊的詞匯。復合式詞匯則是指有由簡單概念組合成的復合概念,部分復合式詞匯在組合后并不能清晰表達單一主題的復合概念,如“青樓宮廷”“騎士與劍”等,對其他用戶而言,并不能明確感知被組合的概念之間的關系。4)網(wǎng)絡流行詞泛濫。網(wǎng)絡文學標簽中存在大量網(wǎng)絡流行詞,雖然符合用戶閱讀習慣,但由于網(wǎng)絡流行語本身存在的時效性短、表述不規(guī)范、審美趣味低等問題,也間接影響了用戶設置的標簽質(zhì)量。與此同時,還促使部分作者利用標簽炒作、賣噱頭,故意設置獵奇標簽吸引用戶關注等問題。近年來熱點的網(wǎng)絡流行詞,如“網(wǎng)紅”,已成為諸如晉江文學城在內(nèi)的部分網(wǎng)站的熱點標簽。起點中文網(wǎng)上則存在“猥瑣”等負面標簽。5)生僻標簽利用率低造成冗余。標簽分類具有明顯的“長尾”特性,高使用率的標簽僅占極小的部分,大部分標簽利用率普遍較低。這是大眾分類法無可回避的弊端。

    4網(wǎng)絡文學標簽規(guī)范化趨勢及手段

    對大眾分類法實現(xiàn)根本意義的規(guī)范控制,有賴于語義信息分析處理技術的發(fā)展,即通過挖掘標簽的內(nèi)部語義信息,對同義詞、近義詞、關聯(lián)詞進行自動聚類,建立起標簽之間的等級層次關系,同時也能達成標簽規(guī)范性自動修正的目的。而在此之前,網(wǎng)絡文學網(wǎng)站依然可以通過適當干預熱門標簽的篩選展示環(huán)節(jié),引導用戶改善現(xiàn)有標簽的規(guī)范性問題。1)同一集團旗下網(wǎng)站、同類型網(wǎng)站增強標簽通用性。目前,標簽一致性程度最高的網(wǎng)絡文學網(wǎng)站為閱文集團旗下的起點中文網(wǎng)和創(chuàng)世中文網(wǎng),兩者檢索頁面顯示的熱門標簽幾乎完全一致。此外,同屬閱文集團的起點女生網(wǎng),雖然是女頻網(wǎng)站,但與起點中文網(wǎng)的標簽熱門重合度也很高。經(jīng)比較,三者在基礎分類頁面、標簽展示頁面、標簽設置頁面均有一定的相似性,篩選熱門標簽時對同義詞的取舍也具有突出的一致性。2)標簽展示系統(tǒng)增加篩查機制和淘汰機制。雖然無法直接干預用戶自定義標簽,但在熱門標簽展示環(huán)節(jié),網(wǎng)站可以對展示出來的標簽進行外在條件上的控制,如對詞長設置上限、將新生的熱門標簽與原有標簽進行比較,排除近義詞,同時對使用頻率較低的標簽下架處理。3)融合基礎分類與標簽分類。網(wǎng)站可以將基礎分類與標簽分類的結果進行對應,長期處于熱門狀態(tài)、并相對穩(wěn)定的標簽可以直接設置為基礎分類的選項,不僅完善了分類項,還能對標簽詞量進行控制。同時對完成基礎分類的作品,在標簽設置環(huán)節(jié),對其備選的熱點標簽根據(jù)其基礎分類進行調(diào)整,引導用戶盡選擇規(guī)范標簽。這一手段本質(zhì)上是將大眾分類法與傳統(tǒng)的知識分類方法進行融合。更為高效的處理方法是將經(jīng)過規(guī)范化的受控詞匯與標簽進行自動關聯(lián)影射。

    作者:盧憶 單位:南京大學信息管理學院

    主站蜘蛛池模板: 日本一区二区三区久久| 亚洲AV永久无码精品一区二区国产| 污污内射在线观看一区二区少妇| 无码日韩人妻AV一区二区三区| 日韩A无码AV一区二区三区| 国产综合视频在线观看一区| 国产精品无码一区二区三级| 日本一区精品久久久久影院| 麻豆天美国产一区在线播放| 精品不卡一区中文字幕| 久久亚洲中文字幕精品一区四| 亚洲一区影音先锋色资源| 精品日韩一区二区| 97av麻豆蜜桃一区二区| 国产拳头交一区二区| 久久精品亚洲一区二区三区浴池 | 亚洲日韩精品一区二区三区| 国产伦精品一区二区三区在线观看| 99无码人妻一区二区三区免费| 自慰无码一区二区三区| 国产av熟女一区二区三区| 日韩毛片一区视频免费| 日韩精品一区二区三区中文字幕 | 国产在线精品一区二区夜色| 亚洲欧美日韩中文字幕一区二区三区 | 精品无码一区二区三区爱欲九九 | 中文字幕一区二区三区四区| 国产一区二区三区在线看片 | 国产精品被窝福利一区| 日本韩国一区二区三区| 亚洲AV无码国产精品永久一区 | 精品日韩在线视频一区二区三区| 中文字幕精品一区二区2021年 | 成人在线观看一区| 亚洲欧美日韩一区二区三区在线 | 国产精品无码一区二区三区电影| 一区二区三区视频免费观看 | 日韩精品一区二区三区不卡| 国产亚洲综合精品一区二区三区 | 久久精品国产亚洲一区二区| 日韩一区二区超清视频|