本站小編為你精心準備了上下文感知手寫數學公式結構參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《湘潭大學自然科學學報》2014年第二期
1數學公式書寫結構分析
書寫過程有規范和即興兩類,本文僅針對規范書寫過程討論.數學公式書寫結構分為一般和非一般兩大類.一般書寫結構指后續字符書寫空間位置位于當前符號的緊鄰8個區位上,即右區位,右上區位、右下區位、上區位、下區位、左區位、左上區位、左下區位.分段函數、分數及水平括蓋等結構為具有典型意義的規范型非一般書寫結構.(1)分段函數結構:圖1為規范型的分段函數書寫結構,花括符右邊第一行方格為第一子段函數數學式子,加粗的橄欖球形狀表示條件符號鏈的最后一個符號;加粗的長方形表示靠近大“{”的下一個子段函數數學式子的第1個符號書寫區位.在書寫至條件符號鏈的最后一個符號之后,下一個符號位于靠近大“{”的下一個子段函數數學式子的第1個符號書寫區位.(2)分數結構:圖2為規范型分數三種常見書寫過程結構.圖2(a)的加粗方框所占的區位代表了分數的最后分子符號區位,箭頭所指的方框代表分母最先符號區位.圖2(b)的加粗方框所占的區位代表了分母最后符號區位,箭頭所指的方框代表脫離分數子式首符號區位.圖2(c)的加粗方框所占的區位代表了分母最后符號區位,箭頭所指的方框代表分子最先符號區位.(3)水平括蓋結構:圖3為上水平括蓋的兩種寫法,圖3(a)為自下而上書寫,每寫一個主鏈符號聯想括蓋符號起始區位和下一個一般書寫結構的主鏈符號區位;圖3(b)先寫上水平括蓋,每寫完一個主符號鏈符號聯想兩個區位,一個是該符號的一般書寫結構后繼區位,另一個就是加粗橢圓所表示的區位.下水平括蓋結構按相反方向描述.白板書寫教學過程難免即興書寫,即興書寫的結構識別需進行專題研究.
2.1一般書寫結構上下文感知模型設計源位符號的緊鄰空間區域按8方向定義,如圖4所示.面向電子白板,源位符號的緊鄰后續符號將處于8方向的何目標位置,或者說處于何目標位置的概率,不同的符號類別有不同的分布,不同的教學層次分布也存在區別.將數學公式符號分為數字、一般運算關系符、不同文種的數學變量字母及特殊意義數學關系符四大類符號.特殊意義數學關系符主要指∑、∏、∫、槡等.前三類符號作為源位符號的書寫鏈接結構均按一般書寫過程完成,稱之為一般書寫結構.一般書寫結構中源位符號后續鏈寫符號8方向目標位置的感知模型由教學層次代碼、感知區位狀態碼及符號鏈接結構所屬教學層次的應用概率(簡稱為教學概率)等三類字段組成,通用結構如表1所示.)為感知區位,SACi∈{0,1},SACi取1系統對相應的表示區位提供符號及區位識別服務,反之不予服務;教學概率參數表明相應區位與源位符號的鏈接結構在該教學層次的出現概率,系統按概率大小,由大到小監測目標符號所在的區位,即系統的后繼服務區位不但要是可感知區位,而且優先考慮教學概率高的區位.當源位符號為數學公式首寫符號,后續符號處于8方位的任何一個區位均有可能,但根據教學層次仍可分為系統服務區位和不服務區位;非首寫符號至少存在1個固定系統不服務區位;系統服務區位數大于等于1,但有效目標區位僅為1個.源位符號關于教學層次的區位上下文感知模型的向量結構記為的各元素均為二元結構,為便于分析時的數據提取,元素位置與圖4所示方位序號嚴格對應.
2.2規范型非一般書寫結構上下文感知模型設計非一般書寫結構指的是不能按圖4表達后繼符號的書寫區位,但這些書寫過程結構仍是相對規范的,即系統仍可根據源位符號為用戶提供相對穩定的服務區位.限于篇幅,本文僅以分段函數結構和分數結構為例討論規范型非一般書寫結構上下文感知模型構造方法.
2.2.1分段函數結構分段函數的標志性符號為大左“{”,多見結構為“={”.如圖1所示,第1子段函數式子的第1個符號按一般書寫結構提供服務,最后1個符號與條件符號鏈的首符號至少相距一個符號寬度,子段函數的每一個符號均應聯想一般和相距一個以上寬度的兩個后繼區位;條件符號鏈的每一個符號同樣應考慮兩個后繼區位,一個是符合一般書寫結構規律的后繼區位,另一個是靠近大“{”的下一個子段函數數學式子的第1個符號書寫區位.基于此聯想結構,在一般書寫結構區位上下文感知模型的基礎上增加兩個服務區位,一個是距離子段函數式子至少一個符號寬度距離的條件符號鏈首字符服務區,二個是進入條件符號鏈后靠近大“{”的新子段函數式子首字符服務區位.分段函數感知模型表示為LLB,其結構為在(1)式中按序增加(SAC9,PEL9),(SAC10,PEL10),SAC9為距離子段函數式子一個符號寬度距離的感知區位狀態碼;SAC10為新子段函數首符號感知區位狀態碼;PEL9、PEL10為相應的教學概率.
2.2.2分數結構依據圖2聯想結構,在一般書寫結構區位上下文感知模型的基礎上增加三個服務區位,一個是分數分母首字符服務區,另外兩個是分數分子首字符和脫離分數子式首符號服務區.以FL表示分數感知模型,其結構為在(1)式中按序增加元素(SAC9,PEL9),(SAC10,PEL10),(SAC11,PEL11),SAC9為分數分母首字符感知區位狀態碼;SAC10為分數分子首字符感知區位狀態碼;SAC11為脫離分數子式首符號感知區位狀態碼;PEL9、PEL10、PEL11為依次相應的教學概率.
2.3特殊意義數學關系符書寫結構上下文感知模型設計圍繞特殊意義數學關系符書寫輔助符號串,輔助符號的完全不可感知區位是不能直接套用一般書寫結構的產生原理,特殊意義數學關系符的上下文感知模型需綜合一般書寫結構與規范型非一般書寫結構的感知模型構建.特殊意義數學關系符的感知模型由三部分組成,一部分是特殊意義數學關系符的后續首符號區位服務;第二部分是輔助符號串中后繼符號區位服務;第三部分為脫離特殊意義數學關系符符號體系后的后繼首符號服務區.
2.3.1∑感知模型構建(1)書寫完∑,需要聯想∑符號的上表達式首符號區位、下表達式首符號區位和右表達式首符號區位;(2)書寫∑的上表達式時,如果下表達式沒有書寫,那么每寫完一個上表達式符號之后,都要聯想兩個后繼區位,一個是符合一般書寫結構規律的后繼區位,另一個后繼區位是下表達式首字符區位;如果下表達式已經書寫,那么每寫完一個上表達式符號之后,還是要聯想兩個后繼區位,一個是符合一般書寫結構規律的后繼區位,另一個后繼區位是右表達式首字符區位.同理有下表達、右表達式的聯想.以SUM表示∑感知模型,其結構為在(1)式中按序增加元素(SAC9,PEL9),(SAC10,PEL10),(SAC11,PEL11),(SAC12,PEL12),SAC9為下表達式首符號感知區位狀態碼;SAC10為上表達式首符號感知區位狀態碼;SAC11為右表達式首符號感知區位狀態碼;SAC12為脫離特殊意義數學關系符符號體系后的后繼首符號區位狀態碼;PEL9、PEL10、PEL11、PEL12分別為依次對應的教學概率.與∑相似結構的有∏、∫等.
2.3.2槡感知模型(1)書寫完槡,需要聯想槡符號的左上表達式首符號區位、內表達式首符號區位.(2)當書寫槡的左上表達式時,如果內表達式沒有書寫,那么每寫完一個左上表達式符號之后,都要聯想兩個后繼區位,一個是符合一般書寫結構規律的后繼區位,另一個后繼區位是內表達式首字符區位;如果內表達式已經書寫,那么每寫完一個左上表達式符號之后,還是要聯想兩個后繼區位,一個是符合一般書寫結構規律的后繼區位,另一個后繼區位是脫離特殊意義數學關系符符號體系后的后繼首符號服務區.同理有內表達式書寫的聯想.以NRT表示槡感知模型,其結構為在(1)式中按序增加元素(SAC9,PEL9),(SAC10,PEL10),(SAC11,PEL11),SAC9為內表達式首符號感知區位狀態碼;SAC10為左上表達式首符號感知區位狀態碼;SAC11為脫離特殊意義數學關系符符號體系后的后繼首符號區位狀態碼;PEL9、PEL10、PEL11分別為依次對應的教學概率.
3結構分析實現
利用字符位置上下文感知模型實現對數學公式在線書寫過程進行跟蹤而實現結構分析.
3.1區位優先級確認對于當前的SBS,根據其符號屬性建立相應的現場實時跟蹤感知模型,模型的內容取自該符號所在的綜合模型庫.現場實時跟蹤感知模型的區位感知狀態碼根據當前SBS的設置,可服務區位的優先級由教學概率大小排序.記→SBS為現場實時跟蹤感知模型向量。
3.2區位服務按→SBS確定的區位優先級有序的區位掃描采集數據.對于一般書寫結構,圖4中各箭頭線為各區位的方向線,與各區位質心和源位符號質心的連線相重疊,1區位方向線吻帖二維坐標系橫軸,設αi為第i區位與橫軸的夾角,i∈{1,2,…,8},[αi-22.5°,αi+22.5°]為第i區位的角度范圍,按此分別建立8個相應的區位書寫信息監測與獲取函數.此外,非一般書寫結構的數學公式根據各自結構特點增加區位書寫信息監測與獲取函數,如分段函數增加2個,分數結構增加3
3.3區位確認根據→SBS與區位預測所獲得的i、A、(cx,cy)進行最終的符號區位確認.A內容用于識別書寫模式.第i區位為優先考慮區位,當該區位不能確認為當前書寫模式所在區位時,依據→SBS內容進行有序確認.不同結構采用不同區位確定依據與方法,一般書寫結構的確定依據為質心連線與橫軸坐標的夾角、教學概率,當夾角處于兩相鄰區位區域交界線的非穩態角偏移角區,按教學概率判決;分段函數的特征結構通過設置后繼首符號質心與“{”的上端點間距閾值、條件符號鏈與子段函數末符號間距閾值進行判決;分數函數的特征結構通過分數線的質心坐標、左端點坐標和右端點坐標與當前輸入符號的質心坐標之間的關系進行分子、分母、脫離分數子式等的首符號區位區分;∑符號體系的特征結構通過∑符號的質心坐標、左上端點坐標及右下端點坐標與當前輸入符號的質心坐標之間的關系進行上表達式首區位、下表達式首區位、右表達式首區位及脫離特殊意義數學關系符符號體系后的后繼首符號區位區分;槡符號體系結構的特征結構通過槡符號中一橫的左端點坐標、右端點坐標以及槡的外包矩形的右下端點坐標與當前輸入符號的質心坐標之間的關系進行左上表達式、內表達式及脫離特殊意義數學關系符符號體系后的后繼首符號區位區分.區位確認的主要步驟如下(1)依據A進行符號識別;(2)源位符號是否屬于特殊意義數學關系符體系符號?是則調用對應的確認子模塊,轉(5);(3)源位符號是否為規范型非一般書寫過程結構體系符號?是則調用對應的確認子模塊,轉(5);(4)調用一般書寫結構符號區位確認子模塊;(5)建立相應符號體系或結構的標準區位標識數據.
4實驗與效果分析
符號識別借鑒[8],實驗符號集如表2中源位符號欄所示,教學概率分別取自[10~12].表2給出按符號屬性分類的各類書寫結構上下文感知模型設計.取αi=(i-1)×45°,第i區位的可靠區位偏移角度△αi1=22.5°,非穩態偏移角度△αi2=5°;分段函數結構分析閾值△σ1=△σ2=15.以小學為例,圖5(a)為觸摸屏書寫的正方形面積計算公式的手寫結構,圖5(b)為投影顯示的識別結果的印刷體.“S”字符為首字符,→SBS=[(SAC1,0.50),(SAC8,0.50)],區位1和區位8的監測時間都為500ms,因為區位1排在區位8的前面,所以優先考慮字符“S”的區位1.當系統監測到penUp事件后,開始嚴格按照各個區位的監測時間反復在“S”字符的區位1和區位8監測“S”的下一個字符的筆跡坐標是出現在區位1的范圍還是區位8的范圍.在1200ms的時候,利用算法2在區位1采集到“-”的筆跡坐標,因此區位監測函數返回假設區位碼1.在系統監測到penUp事件后,返回“-”的整個坐標點集,接著區位識別函數優先考慮“-”是否真的在“S”字符的區位1當中,“-”與“S”形成的角度β=2°,α1-△α11+△α12≤β≤α1+△α11-△α12,因此“-”確實在“S”的區位1當中.后續的服務與識別過程大同小異.圖6(a)、(c)、(e)分別是三個手寫數學公式,(b)、(d)、(f)分別為對應識別結果的印刷體投影顯示.表3給出源位符號為數字符號時其后繼符號區位跟蹤時間的比較,數據表明,本文方法對于可服務區的區位確定時間差異不大,而文獻[1]使得常鏈區位與不常鏈區位的區位確定時間相差較大,在不常鏈區位的確定時間上,本文方法明顯快于現有方法.書寫過程中不常鏈區位出現越多,本文方法的速率優勢越突出。圖7為本文方法與文獻[1]、文獻[2]方法就高中層次中20個實驗公式所含301個區位的識別率比較.數據表明本文方法具有更高的區位識別率.
5結束語
利用不同教學層次的公式復雜度及子結構出現概率的區別進行手寫數學公式識別有利于深化數學公式識別研究.本文給出基于上下文感知聯機手寫數學公式符號區位跟蹤結構識別方法,取得的成果主要有:(1)提出了結合區位感知與教學概率的上下文感知聯機手寫數學公式符號區位跟蹤模型;(2)設計并實現了基于區位跟蹤的結構分析算法.關鍵指標明顯改善.本文方法也可借鑒于其他與結構相關的教學內容實現手寫模式轉換為印刷體模式的投影顯示,如化學分子式、樂譜、基本圖形及工程圖學等。
作者:馮任昆戴永王求真李璇喻世東單位:湘潭大學智能計算與信息處理教育部重點實驗室
本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。