1樓:網友
你靜下心來把概率論裡的什麼是正態分佈看懂了,自然就能用程式語言寫出這個判斷了,你不要我能把**給你寫出來,沒有這個時間。
用遺傳演算法做一下。
在資料探勘過程中,好像有些演算法要求變數必須是正太分佈的,我想知道什麼時候需要對資料進行標準化處理?
2樓:白肚河蟹不讓說
標準化/歸一化都是對變數進行scale的資料預處理基本方法,是否採用或採用哪種,完全取決於你使用的資料分析處理演算法的需求。
此類預處理主要有兩個目的,一是使變數間尺度接近,避免出現計算誤差或影響如距離之類度量的均衡性。二是使各變數值或樣本向量的度量值在演算法要求的區間內。
至於正態分佈性,一般是演算法的適用假設,應該在演算法應用前或後做此檢驗以保證可靠性,而不是要求用什麼變換方法把資料處理成正態分佈。如誤差的正態分佈假設是迴歸無偏的基本條件,或某些基於類簇是正態分佈的聚類演算法只有在問題確實符合這種模式下才能得到正確結果。
當然,如果僅僅要將特定分佈資料轉換成另一種分佈還是有辦法的。但用途應該比較特殊。
3樓:網友
這跟資料預處理可能有關係,當要使用的實驗資料沒有滿足實驗要求時,就需要對資料進行規範化處理。
初次接觸,正態分佈圖中的頻數和累計是怎麼算的?**等,請詳細說明演算法。
4樓:廣州力撲智慧型
先將原始分數的頻數轉化為相對累積頻數(百分等級),將它視為正態分佈的概率,然後通過查正態分佈表中概率值相對應的z值,將其轉化為z分數,達到正態化的目的。在spss上的操作方法:工具欄transform-rankcases,將左邊你要進行正態化的變數拖入右邊「變數」框中;點選ranktypes對話窗,選中normalscores選項(共四種計算方法,系統預設的是bloom計算方法,可根據你的需要進行改進),點選continue,會在資料觀察表中生成兩列新變數,其中n總分變數就是想要的正態化結果。
如何產生正態分佈的隨機數?
5樓:胡思亂想思密達
這個要看你的具體需求,有幾種方法可以推薦。
首先最簡單:rejection sampling,思維方式非常簡單,容易實現,但效率很差更復雜:逆提供,直接使用累積分佈函式的逆函式(cdf)生成隨機數,但涉及更復雜的計算誤差函式的小塊土地(非初等函式)更好:
盒子-穆勒演算法,生成在很長一段時間的正態分佈隨機數的「標準」演算法。
box- muller演算法的特點是效率高,易於計算(只有基本的函式)。參見:boxer - muller變換目前是最好的(與其他實用演算法相比):
ziggurat演算法是非常有效的,許多現代程式語言都使用這個演算法。
ziggurat不是人的名字,它的意思是「ziggurat」,而不是埃及的金字塔,但是古蘇美爾人的金字塔結構建造了祭壇:神殿由多個平臺組成,平臺的每一層都是長方形的,橢圓形的或正方形的,面積逐漸從底部下降到頂部。ziggurat演算法實際上是乙個改進的拒絕取樣,包含乙個查詢表操作。
所以不管是那種演算法,都需要你去花些功夫來了解一下,是不是適合自己,是不是適合去解決現在自己正在面臨的問題,畢竟別的經驗都只是一些參考。在自己的實踐中逐步去發現自己的問題,找到最適合自己的很重要
如何用spss判斷一組資料是否滿足正態分佈
6樓:小火柴蔣
檢驗方法一:看偏度係數和峰度係數
我們把spss結果最上面的乙個**拿出來看看(見下圖):
偏度係數skewness=;峰度係數kurtosis=;兩個係數都小於1,可認為近似於正態分佈。
檢驗方法二:單個樣本k-s檢驗
在spss裡執行「分析—>非引數檢驗—>單個樣本k-s檢驗,彈出對話方塊,檢驗變數選擇「期初平均分」,檢驗分佈選擇「正態分佈」,然後點「確定」。
檢驗結果為:
從結果可以看出,k-s檢驗中,z值為,p值 (sig
2-tailed)=>,因此資料呈近似正態分佈。
檢驗方法三:q-q圖檢驗
在spss裡執行「圖表—>q-q圖」,彈出對話方塊,見下圖:
變數選擇「期初平均分」,檢驗分佈選擇「正態」,其他選擇預設,然後點「確定」,最後可以得到q-q圖檢驗結果,結果很多,我們只需要看最後乙個圖,見下圖。
qq plot 中,各點近似圍繞著直線,說明資料呈近似正態分佈。
7樓:匿名使用者
檢驗正態分佈的bai辦法:
1、在duspss選單中選擇分析——描zhi述統計dao——探索,將需要。
內檢驗的變數放入因變數裡容面,選擇「繪製——帶檢驗的正態圖,看一下tests of normality就可以,如果成正態,sig不會小於臨界值。
2、 還可以參考qq圖,如果是正態,qq圖裡的散點回呈直線,normal qq圖的橫座標是實際的資料從小到大排列,縱座標是正態分佈的期望值,所以如果實際的和正態的期望相符,散點圖就會呈一條直線;detrended qq圖的橫座標是實際觀測值,縱座標是實際觀測值減去期望值,如果資料符合正態,那麼散點應當在**橫線附近。
8樓:南心網心理統計
這個需要做k-s檢驗或者直方圖,可以幫您。
請教乙個正態分佈函式的數值計算方法
9樓:匿名使用者
一般來說。
如果獨立的隨機變數x_i~n(a_i,b_i^2) i=1,2,,.n
那麼x_1+..x_n服從正態分佈n(a_1+..a_n , b_1^2+..b_n^2)
這一事實可以通過概率特徵函式得到。
如果沒有學過的話,可以通過歸納法得到。
就是計算兩個正態分佈的和,然後歸納到n的情形。
請問,資料如果不服從正態分佈,實用spss轉換時,除了實用ln,lg,sqrt等演算法,還可不可以用別的函式?
10樓:呂秀才
可以使用你找到的你的演算法來進行轉換,也就是你在用後期的需要正太分佈的演算法時 就以轉換後的資料來進行計算, 但是最終你還是要把它還原回去需要原始資料來進行解釋的。
如何用一組資料估計出其最符合的正態分佈的引數
excel只能做粗略bai的正態分du布圖 將數量從zhi200到600,按每間隔dao50 也可以按30 60 統專計出現次數,如200 屬250,250 300,300 350,將各區間段的出現次數做直方圖,如果資料滿足正態分佈,出來的結果就是正態分佈圖。如何用一組資料估計出其最符合的正態分佈的...
如何計算一組資料的波動率,如何計算一組資料的穩定程度
波動來率 有重要意義 的第源二高 低 點 有重bai要意義的第一髙 低 兩高du 低 點間的時間。zhi這個公式的意dao義是 1 是根據歷史的資料。進一步講,新股只有經過一段時間的運動觀察後,才可以進行 2 重要的低點是判斷的關鍵,點選錯了,就不具有計算的意義。3 高低重要 支 點的選擇要注意與時...
一組資料1,4,2,5,3,6,7的中位數是
將資料按照從小到大的順序排列為1,2,3,4,5,6,7,最中間的數為4,所以這組資料的中位數為4.故答案為4.一組資料 1,2,3,4,5,6,7,8,9,2,4,6,2,眾數和中位數分別為 a.9和5 b.6和6 c 先對這du組資料按 從小到大的zhi順序重新排 dao序 1,版2,2,2,3...