近幾年來,儀器儀表行業(yè)按照市場經(jīng)濟規(guī)模的要求,加大企業(yè)結(jié)構(gòu)調(diào)整力度,企業(yè)間通過聯(lián)合、兼并等方式,從而使決策樹生成算法在儀器儀表行業(yè)有了一定的影響力。
一、決策樹生成算法在儀器儀表行業(yè)中淵源:
在當(dāng)今的市場經(jīng)濟社會, 納稅人在偷稅前要權(quán)衡得失, 只有當(dāng)偷稅成本低于偷稅收益時, 偷稅才可能成為現(xiàn)實。本文通過應(yīng)用數(shù)據(jù)挖掘決策樹生成算法, 從龐大的稅收數(shù)據(jù)中挖掘建立偷稅決策樹, 可以幫助稅務(wù)管理人員提高對納稅人偷稅行為的判斷準(zhǔn)確性, 提高對偷稅行為的查處概率( 目前我國的查處概率大約在40%) , 提高納稅人的偷稅成本, 使納稅人意識到偷稅會“得不償失”, 來減少納稅人偷稅行為的發(fā)生?;緵Q策樹算法是一個貪心算法, C5.0 是有名的決策樹算法, 它通過選擇信息增益( 熵減少的程度) 的屬性作為測試屬性并產(chǎn)生分支節(jié)點, 并根據(jù)這一屬性的取值產(chǎn)生相應(yīng)的( 決策樹) 分支, 對產(chǎn)生的( 決策樹) 分支遞歸處理, 又獲得一個決策( 子) 樹, 直至滿足停止條件, 產(chǎn)生一棵完整的決策樹。本文通過運用基于貪心算法的數(shù)據(jù)挖掘工具, 對稅收征收管理數(shù)據(jù)和企業(yè)財務(wù)數(shù)據(jù)進行處理, 生成納稅人偷稅決策樹,并應(yīng)用于稅務(wù)稽查選案工作中, 收到了良好效果。
二、決策樹生成算法在儀器儀表行業(yè)中基本概念:
數(shù)據(jù)挖掘, 又稱為數(shù)據(jù)庫知識發(fā)現(xiàn)( Knowledge Discovery fromDatabase, 簡稱KDD) , 它是一個從大量數(shù)據(jù)中抽取挖掘出未知的、有價值的模式或規(guī)律等知識的復(fù)雜過程。決策樹是數(shù)據(jù)挖掘分類與預(yù)測的一種。它是一個類似流程圖的樹型結(jié)構(gòu), 其中樹的每個節(jié)點代表對一個屬性的測試, 其分支就代表測試的每個結(jié)果; 而每個葉節(jié)點就代表一個類別。圖1 是根據(jù)來自加拿大的勞動合同談判數(shù)據(jù)集合所挖掘出的決策樹。
決策樹生成算法在儀器儀表行業(yè)中,具有一定的意義,儀器儀表產(chǎn)品結(jié)構(gòu)基本合理,各類產(chǎn)品的發(fā)展比較協(xié)調(diào)。
http://www.dgzhenghang.cn