Professional Documents
Culture Documents
0026 AnirvinNarayan Math HL IA
0026 AnirvinNarayan Math HL IA
Am fost curios cum a fost calculată o astfel de măsură crucială care a definit diverse politici
guvernamentale, rezistând disparității veniturilor într-o regiune geografică și vastității datelor
necesare pentru un calcul precis în țări precum India. Acest lucru a condus cercetarea mea de
bază în domeniul din care am descoperit prevalența matematicii în generalizarea formulelor
pentru a reprezenta inegalitatea economică. Prin lecțiile din școală, am reușit să recunosc
principiile de bază din spatele unora dintre aceste formule care m-au cercetat în continuare
pentru a investiga. Acest lucru se datorează faptului că, o dorință suplimentară a mea a fost să
aplic studiul profund pe care l-am făcut despre analiza matematică și seriile în școală la ceva
mai tangibil și mai real.
Există o serie de moduri diferite de a calcula coeficientul Gini. Acestea includ metode grafice
care implică cumularea diferitelor puncte de date și frecvențe, cum ar fi curba Lorenz și cele
mai teoretice, cum ar fi funcția de distribuție a lui Pareto. Acestea sunt cele 2 metode pe care le
voi analiza și compara între ele.
10x -
Figura 2 prezintă o curbă Lorenz arbitrară, dar posibilă: L1(x) = . Gradul de
1023
Inegalitatea veniturilor este definită de abaterea curbei Lorenz de la linia inegalității
perfecte. Această abatere (coeficientul Gini) este măsurată prin aria de sub curba Lorenz,
după cum vom observa.
Cu un grafic de curbă Lorenz precum cel de mai sus, putem măsura coeficientul Gini.
Formula generală care trebuie utilizată în investigație este reprezentată de următoarea
integrală:
∫
G = 2 0 1L 0(x)-L(x)dx
Aceasta calculează aria dintre curba inegalității perfecte și o curbă Lorenz împărțită la aria
de sub curba inegalității perfecte. În figura 1, de exemplu, coeficientul Gini de L 1 (x) este
măsurat ca aria LA (aria Lorenz) dintre curbă și L 0 (x) împărțită la aria de sub L 0 (x)
evidențiată în magenta și, respectiv, portocaliu. Deoarece în punctul B coordonatele sunt
(1,1) , aceasta formează un triunghi dreptunghic cu punctul A și (1,0) fiind celelalte două
vârfuri, care este evidențiat într-o nuanță deschisă de portocaliu.
1 1 Prin
urmare, aria de sub curba capitalului propriu este aria de sub un triunghi, care este 2×1×1
=2.
G = LA = 2 LA←⎯→ LA = G
1/2
2
unde LA este aria dintre cele două curbe menționate anterior și G este coeficientul Gini al
L 2(x) , cu referire la figura 2. Cu toate acestea, formula generală este dificil de utilizat în
situații reale. Acest lucru se datorează faptului că națiunile colectează date brute de la
populația lor în număr mare, ceea ce poate fi dificil de formulat ca un grafic generalizat. Eu
5
va încerca să facă acest lucru folosind regula trapezului cu un set limitat de date obținute
din datele oficiale ale recensământului din categoriile de venit ale Indiei, așa cum se vede
în tabelul următor.
Proporția Proporția
populației: veniturilor (care se
(convertind % în convertește % în
zecimale) xi zecimale yi
1 0 0
2 0,2 (prima chintilă) 0.061
3 0.153
0,4 (a doua chintilă)
4 0,6 (a treia chintilă) 0.279
5 0.468
0,8 (a patra chintilă)
Tabelul 1: Tabel de frecvență cumulativă care Figura 3: Parcela de împrăștiere a proporției venitului
prezintă venitul Indiei în chintile chintilă din India
Regula trapezului se referă la o regulă de integrare numerică care estimează aria de sub o
curbă. Ca atare, este o modalitate de estimare a integralelor curbelor prin segregarea ariei
de sub curbă într-un număr de trapezuri, ale căror suprafețe sunt apoi însumate. Pentru a
găsi coeficientul Gini, punctele de date din tabelul 1 pot fi utilizate pentru a formula un
număr de trapezuri pentru a reprezenta o curbă Lorenz estimată, așa cum se vede în
6
figura de mai jos:
Figura 4: Aria de sub o curbă Lorenz estimată, formulată
cu regula trapezului
7
Aici, aria însumată a trapezurilor T1, T2, T3 și T4 și triunghiul TR1 (în roșu) scăzând cu
aria TR0 (în verde) reprezintă aria LA. Aria TR0, triunghiul de sub L0 (x) este 1/2. Prin
urmare, în conformitate cu formula enunțată mai sus, coeficientul Gini estimat folosind
regula trapezului va fi:
G=0,5-(0,01+0,02+0,04+0,07+0,15)=0,21=0,420
0.5 0.5
Această valoare este o mare subestimare a valorii declarate de guvern a coeficientului care
este G = 0,510. Acest lucru sugerează că regula Trapezium are ca rezultat prezența unei
prejudecăți negative pentru calcularea coeficientului Gini, făcându-l o măsură în mare măsură
ineficientă.
8
Metoda 2: Utilizarea curbei Lorenz: regresie polinomială
Pentru a rectifica această limitare și a formula o curbă Lorenz mai precisă, voi încerca să
formulez un graf polinomial folosind regresia polinomială. Aceasta se referă la o metodă de
ajustare a curbei cu ajutorul căreia un set de date este aproximat folosind o funcție
polinomială care ia forma f(x) = C +C x 1 + x 2 ...+ C x n unde C se referă la un set de
C +
la gradul funcției polinomiale. Aici, diferența dintre valoarea măsurată a lui y i și valoarea
reală a lui yi este denumită valoarea reziduală R .
Modelul general pentru regresia polinomială poate fi creat folosind metoda celor mai mici
pătrate. Această metodă încearcă să reducă varianța dintre valori pentru a se potrivi cu
precizie punctelor de date, găsind cea mai mică sumă de reziduuri. Deoarece modelele de
regresie liniară și polinomială sunt adesea nesigure, tinzând să descrie în mod
necorespunzător datele, reziduurile sunt utilizate pentru a examina acuratețea acestora. Un
punct rezidual (e) se referă la diferența dintre valoarea reală a variabilei dependente (y) și
valoarea prezisă de punctele de pe o curbă de regresie (y1) ("Găsirea reziduurilor")).
SSR i 0 1 i n
)
⎤⎦ i =1
Pentru a minimiza polinomul, luăm derivate parțiale ale acestei funcții în raport cu fiecare
dintre constante ( C ), unde echivalăm rezidualul cu 0 pentru a găsi cea mai mică valoare a
SR (suma reziduurilor). Derivatele parțiale se referă la derivatele unei funcții cu variabile
multiple, unde toate variabilele, cu excepția C , sunt considerate fixe (Weisstein).
Pentru a găsi curba Lorenz a Indiei, voi limita investigația la regresia pătratică, unde
ecuația generală este:
yi = C 2 x 2 + C 1 + C0 x
n2
unde:
SSR ≡∑⎡⎣y -(C +C x +C 2 x =1
i 0 1 i i2) ⎤⎦i
∂(C ) ∑ ⎣
0 ⎦ i=1 0 1 2
∂C )
( = -2∑⎡⎣y- (C 0 +C1x+C 2 x2) x= ⎤⎦
0
∂ C ) = -2 ⎡⎣y-(C 0 +C 1x+
( ∑ C 2 x 2 )⎤⎦x 2= 0
n nn
C 0n + C 1∑x i
i=1
+ C 2∑x i 2
i=1
= i=1
∑
y
i ecuația (a)
n n nn
n n nn
C0∑x i 2 i=1
+C 1∑x i 3+C 2∑x i
i=1
4 i=1 i=1
=∑x i 2 y i ecuația (c)
∑ ∑ ∑
n n n
yi
xi i=1 C0 i=1
∑
n n xn i 2
n
(1) C1
1
Crearea matricei și reprezentarea sa a celor 3 ecuații de mai sus poate fi observată 0
prin
examinarea multiplicării matricelor din partea dreaptă a (1). Pentru a multiplica două
matrice, trebuie să facem produsul dot al fiecărui rând al primei matrice și singura coloană
a celei de-a doua matrice. Aceasta calculează suma tuturor produselor membrilor potriviți,
după cum se vede mai jos:
>x
i=1 i=1
x
nn n C
∑∑ xi xi 2 o
∑∑
n n n C
∑ ∑
xi 2
xi 3
xi
xi 3
4
,
nn
=C n+C x +C x 2
0 1 i 2i
i=1 i=1
n
= ∑ i =1
yi
După cum se vede, găsirea produsului punct al primului rând al primei matrice și al celei
de-a doua matrice produce ecuația (a). Găsirea produsului punct al următoarelor două
rânduri ale primei matrice va avea ca rezultat ecuația (b) și (c). Prin urmare, matricele pot fi
utilizate pentru a reprezenta ecuațiile (a), (b) și (c).
Putem determina valoarea constantelor înmulțind ambele părți ale lui (1) cu
Prima matrice transpusă:
-1
∑∑ ∑
n n n
n
yi
C0 xi xi i=1
∑ ∑
2
n
i=1 n
i=1
C1
∑
n
∑
n
C2 x i x
i=1 x i2
i
i =1 xi i=1
∑ ∑ ∑
n 3 yi
n i=1
n
n
Ef
Salut
-1
1 î.Hr cure
nt
Salu Gi
t
î.Hr Ab
Ef de
Df
IMI= -b +c = a(ei - fh)-b(di- fg)+c(dh-eg)
a Gi
O curbă poate fi apoi generată pentru o funcție pătratică prin rezolvarea coeficienților din
matrice. În cazul Indiei, avem informațiile privind proporția veniturilor obținute de fiecare
chintilă a populației prezentată în tabelul 1.
⎡6 3 ⎤ ⎡ 1.961
⎤ —1
C
0 3
2.29
C1
⎥ 2.29 1.8
⎥ 1.6152
C2
⎥ ⎣⎢ 1.8
1.5664 ⎦ ⎥ ⎣⎢
⎦
Pentru a rezolva inversul matricei, trebuie mai întâi să găsim determinantul său, care poate
fi calculat prin însumarea produsului unui cofactor al primului rând și a matricei minore
respective:
1 ⎢ 3 2.29 6 2.29 63 ⎥
0.60347 1.8 1.5664 2.29 1.5664 2.29 1.8 ⎥
⎥
⎢ 3 2.29 6 2.29 63 ⎥⎥
2.29 1.8 3 1.8 3 2.29 ⎦⎥
⎣⎢ ⎥
C0 -0.04139503523151611
C1
-0.04057415997524583
C2
1.0179444066877004
y = 1, 02 x - 0, 041x - 0, 041
2
În ecuația de mai sus, coeficienții au fost reprezentați până la 3 cifre semnificative pentru
ușurința observării. Curba Lorenz rezultată (Lq) în mijlocul punctelor de împrăștiere de
intrare poate fi văzută mai jos:
Din natura curbei, putem spune că nu trece prin punctele de date exultate în tabelul 1.
Acest lucru sugerează că predicția valorilor y pentru toate x pe baza unui set limitat de date
nu descrie cu exactitate proporția veniturilor fiecărui segment al populației pentru India. Din
abaterile punctelor de date (evidențiate prin punctele roșii din figura 6) de la curba de
potrivire cea mai bună, putem formula un tabel pentru a descrie fiecare punct rezidual:
y
x y1 e
Deoarece avem 6 puncte de date, o ecuație polinomială de gradul cinci poate fi construită
pentru a reprezenta curba Lorenz. Am ales să folosesc aici un polinom de gradul cinci cu
ecuația generală de, yi = C 5 x 5 +C 4 x 4 + C 3 x3 + C 2 x2 +C 1 +C0 , deoarece aceasta x
este ordinea maximă a unui polinom care poate fi creat folosind 6 puncte de date, probabil
rezultând cea mai precisă curbă Lorenz posibilă. Ecuația menționată anterior (1) poate fi
scrisă alternativ ca:
⎡⎤ ⎡⎤ ⎥ ⎡⎤ y
⎢ x1 x12 ⎥
⎢ 1
⎥
⎥
X! ⎢ 0 = ⎢ y
1 x 2 ⎢
⎥! ⎥ 2⎥ 2
C
1
⎢⎢!1 ⎥ ⎣ C ⎢ ⎥ ⎢
2
⎥
⎢ x
⎣
⎦
n
⎣⎢ ⎦xn2 ⎦⎥
unde n se referă la numărul de coordonate xși y . Prima matrice din ecuația de mai sus este
cunoscută sub numele de matrice Vandermonde, care este un tip de matrice care apare în
potrivirea polinomială a celor mai mici pătrate (Weisstein). În cazul unui polinom de gradul
al cincilea, folosind valorile din tabelul 1, acesta este reprezentat ca:
⎥ ⎤⎡⎢
⎡⎢
⎢ 00 0 0 ⎥⎡0⎤ ⎢0 ⎥
⎢1 1 11 1 1
⎥⎢
⎥ 0.468 ⎥ ⎥⎢ C
⎣ ⎢1 ⎥⎣ 1⎦⎥ ⎦⎢ 4 ⎢
⎣⎢ ⎥
-1 ⎡ 0 ⎤
⎤
⎡
C ⎢ ⎥ ⎡1 0 0 ⎤
⎢ ⎥
⎣⎢ ⎥ ⎥
1
5
Efectuând pașii menționați mai sus privind inversarea și înmulțirea matricei folosind I.T. (un
calculator), datorită mărimii matricei obținem următoarea matrice pentru constante:
0
C0 0.363692946057596
-1.30244640387085
C1 6.54629149376606
C2 -10.1476054633385
5.54006742737785
C3
C4 Din aceste valori, ecuația pentru curba Lorenz a Indiei
C5 în 2013 va fi:
văzută ca curba Lorenz în diagrama de mai jos, cu diferitele puncte de împrăștiere care
definesc chintilele de venit ale Indiei din tabelul 1.
În comparație cu curba Lorenz derivată din regresia pătratică, se observă că utilizarea unui
polinom de gradul 5 este mai potrivită pentru a calcula curba Lorenz, deoarece trece atât
∫1
x - (5.540 x5 - 10.148 x 4 + 6.546 x 3 - 1.302 x 2 + 0.364 x)dx
= 0.443
După cum se poate observa, această curbă Lorenz nu are nicio abatere de la punctele de
date, deoarece le interesează pe toate cele 6 văzute în tabelul 1. Deoarece nu există
puncte reziduale, acest lucru sugerează că este o descriere mai exactă a distribuției
veniturilor din India pe care Lq a obținut-o cu regresie polinomială.
Conform datelor oficiale, coeficientul Gini al Indiei în 2013 a fost G = 0,510, care nu este
echivalent cu coeficientul Gini calculat din curba Lorenz prezisă, L . Acest lucru ar putea fi
rezultatul unei game limitate de date utilizate, ceea ce reduce viabilitatea socio-politică a
calculelor și nu estimează cu exactitate coeficientul Gini. În acest caz, regresia polinomială
pentru a schița o curbă Lorenz ar fi mai precisă cu un set mai mare de date.
∫
G = 2 0 1L 0(x)-L(x)dx
=1-2 ∫ 1
L(x)dx
′
F (x)=f(x)
unde pentru o valoare dată a lui x, proporția p poate fi definită alternativ ca:
∫
p= f(x)=F(x)
0
G = 1 - 2 L(p)dx
0
∫
. . 2 ... . . ...
unde C ov este covarianța = Cov(x,F(x)) între nivelurile de venit y și
Distribuția cumulativă a μ
același venit F(y) și μ este venitul mediu.
Tabelul de mai jos reprezintă veniturile gospodăriilor pentru fiecare dintre chintilele din
India, ca o extensie a tabelului 1:
Înțelegerea ideii de covarianță a fost deosebit de dificilă pentru mine, deoarece statistica a
fost un subiect care nu a fost vizitat în niciuna dintre lecțiile mele de matematică. Ca atare,
spre deosebire de una formulă, am încercat să înțeleg grafic și să explic conceptul.
Folosind datele pereche din tabelul 3, un grafic de împrăștiere este văzut mai jos:
1
8
∑ (x i-x)(y i-y)
Cov(x,y)= i =1
n-1
unde: = variabilă independentă
x
y = variabilă dependentă
n = numărul de puncte de date
x = media variabilei independente,
x
y = media variabilei dependente,
y mai întâi x
Folosind valorile din tabelul 3, putem calcula
și y .
5
x= ∑ xi
5 i=1
= = 0.6
∑
3
55
i 308, 721
=61.744,2=μ
y=i=1 = 5
∑ (x i-x)(y i-y)
Cov(x,y)= i= 1
4
Formula covarianței:
G= 2 × 15277.2
61744.2
= 0.495
După cum se poate observa, valoarea G = 0,495 nu este echivalentă cu valoarea declarată
oficial pentru Coeficientul Gini al Indiei în 2013 de G = 0,510, calculată și publicată de
guvernul indian folosind datele complete. Cu doar 5 niveluri generalizate de venit utilizate
pentru a determina covarianța dintre nivelurile veniturilor și proporțiile populației din India,
acest lucru este inevitabil. Folosind un număr limitat de puncte de date, mi-am dat seama
că ignor diverse idiosincrazii care pot fi prezente în distribuția veniturilor fiecărui segment
individual. Acest lucru a dus la o subestimare a coeficientului Gini al Indiei.
Ca și în cazul primei metode, motivul discrepanței constă cel mai probabil în accesul limitat
pe care un civil îl are la datele privind venitul național. Acest lucru creează provocări în
observarea eficacității metodelor distincte de calculare a coeficientului Gini.
Discuții și analize
În această investigație, am încercat să prezint o analiză a trei metode formule pentru a
calcula coeficientul Gini; două bazate pe rapoartele de suprafață sub o curbă Lorenz și
cealaltă bazată pe formule de covarianță.
În general, coeficientul Gini are limitări ca măsură a inegalității. Unul dintre cele mai
importante este că coeficientul nu este aditiv pe diferite segmente ale unei populații și nu
reușește să ignore nuanțele disparității veniturilor care pot exista în cadrul fiecărui
segment. Pentru o mai bună judecată a gradului de inegalitate al unei națiuni, coeficientul
este utilizat împreună cu alți indici ai inegalității veniturilor, cum ar fi indicele Theil, care
este aditiv pe diferite segmente de populație și măsuri. Acesta identifică ponderea
inegalității atribuibile componentelor dintre regiuni și măsoară pe baza formulelor entropiei
generale, atenuând unele dintre limitările coeficientului Gini. /cita/
Ipoteze și limitări
În cadrul anchetei, nu a fost explorată utilizarea coeficientului Gini ca instrument de
comparare a inegalităților în materie de venituri din mai multe țări. Aceasta ar fi putut fi o
posibilă extindere a anchetei, care ar fi putut oferi, de asemenea, o înțelegere mai profundă
a relevanței sale în inegalitatea economică modernă și a fiabilității sale ca atare.
Concluzie
Investigația ne-a permis să determinăm diferitele implicații și calcule ale coeficienților Gini
care pot varia numeric în funcție de nuanțele fiecărei metode. Lucrul cu coeficientul Gini și
cu atât de multe domenii ale matematicii care erau noi pentru mine mi-a permis să apreciez
ideea de inegalitate, împărțirea resurselor monetare și matematica aplicată în zilele
2
1
noastre. Am fost uimit de cât de drastică era diferența dintre chintilele cele mai mici și cele
mai înalte ale populației cu venituri din India, o perspectivă care nu ar fi fost la fel de
revelatoare fără a le deriva matematic prin curbele Lorenz. Analiza cantitativă și empirică a
problemelor sociale, cum ar fi inegalitatea veniturilor, mi-a permis să-mi lărgesc
perspectiva asupra implicațiilor și gravității acestei probleme predominante.
2
2
Bibliografie
Bourne, Murray. "Coeficientul Gini de distribuție a bogăției". Intmathcom RSS. N.p., 24
februarie 2010. Web. 07 martie 2017.
Nair, Remya. FMI avertizează cu privire la creșterea inegalității în India și China. Http://
www.livemint.com/. Livemint, 03 mai 2016. Web. 07 martie 2017.
"Găsirea reziduurilor". Interactiv: Găsirea reziduurilor. CSERD, n.d. Web. 23 martie 2017.
Weisstein, Eric W. "Matricea Vandermonde". De la MathWorld - o resursă web Wolfram.
http://mathworld.wolfram.com/VandermondeMatrix.html. 23 martie 2017.
Lubrano, Michael. "Econometria inegalității și sărăciei." (n.d.): n. pag. Http://
www.vcharite.univ-mrs.fr/PP/lubrano/cours/Lecture-4.pdf. Septembrie 2016. Web.
24 martie
2017.