ძირითადი სტატისტიკის მიდგომა რაოდენობრივი მონაცემების ანალიზისთვის
ხაზოვანი რეგრესიის მოდელები გამოიყენება ორი ცვლადის ან ფაქტორების ურთიერთკავშირის შესასწავლად ან პროგნოზირებაზე. ფაქტორი, რომელიც იწინასწარმეტყველა (ფაქტორი, რომ განტოლება წყვეტს ) ეწოდება დამოკიდებული ცვლადი. ფაქტორები, რომლებიც გამოიყენება დამოკიდებული ცვლადის ღირებულების პროგნოზირებისთვის, უწოდებენ დამოუკიდებელ ცვლადებს.
კარგი მონაცემები ყოველთვის არ იძლევა სრულ ამბავს. რეგრესიული ანალიზი ხშირად გამოიყენება კვლევაში, რადგან ადგენს, რომ კორელაცია ცვლადებს შორის არსებობს.
მაგრამ კორელაცია არ არის იგივე, რაც მიზეზს წარმოადგენს . მაშინაც კი, ხაზი მარტივი ხაზოვანი რეგრესია, რომელიც შეესაბამება მონაცემთა რაოდენობა კარგად შეიძლება არ ვამბობ რაღაც საბოლოო შესახებ მიზეზი და ეფექტი ურთიერთობისათვის.
მარტივი ხაზოვანი რეგრესიის დროს, თითოეული დაკვირვება შედგება ორი ღირებულებისგან. ერთი მნიშვნელობა არის დამოკიდებული ცვლადი და ერთი მნიშვნელობა დამოუკიდებელი ცვლადისთვის.
- მარტივი ხაზოვანი რეგრესიული ანალიზი რეგრესიული ანალიზის უმარტივესი ფორმა დამოკიდებულია ცვლადზე და ერთ დამოუკიდებელ ცვლადზე. ამ მარტივი მოდელით , სწორი ხაზი დაახლოებულია დამოკიდებულ ცვლადსა და დამოუკიდებელ ცვლადს შორის.
- Multiple Regression Analysis როდესაც ორი ან მეტი დამოუკიდებელი ცვლადი გამოიყენება რეგრესიული ანალიზის დროს, მოდელი აღარ არის მარტივი ხაზოვანი.
მარტივი ხაზოვანი რეგრესიული მოდელი
მარტივი ხაზოვანი რეგრესიული მოდელი წარმოდგენილია: y = ( β 0 + β 1 + Ε
მათემატიკური კონვენციით, ორი ფაქტორი, რომელიც ჩართულია მარტივი ხაზოვანი რეგრესიის ანალიზში, არის დადგენილი x და y .
განტოლება, რომელიც აღწერს x- სთან დაკავშირებულ მნიშვნელობას, ცნობილია როგორც რეგრესიული მოდელი . წრფივი რეგრესიის მოდელი ასევე შეიცავს შეცდომას, რომელიც წარმოდგენილია Ε ან ბერძნული წერილის ეპსილონის მიერ. შეცდომის გამოყენება გამოიყენება y- ზე ცვალებადობაზე, რომელიც არ შეიძლება განმარტებდეს x და y- ს შორის ხაზოვანი ურთიერთობით .
ასევე არსებობს პარამეტრი, რომელიც წარმოადგენს მოსახლეობის შესწავლას. ეს პარამეტრი მოდელი, რომელიც წარმოდგენილია ( β 0+ β 1 x ).
მარტივი ხაზოვანი რეგრესიული მოდელი
მარტივი ხაზოვანი რეგრესიის განტოლება წარმოდგენილია: Ε ( y ) = ( β 0 + β 1 x ).
მარტივი ხაზოვანი რეგრესიის განტოლება არის სწორი, როგორც სწორი ხაზი.
( β 0 არის რეგრესიული ხაზის y ინტერცევა.
β 1 არის ფერდობზე.
Ε ( y ) არის x- ის მნიშვნელობაზე y ან საშუალო ან მოსალოდნელი ღირებულება.
რეგრესიის ხაზს შეუძლია დადებითი წრფივი ურთიერთობა, უარყოფითი წრფივი ურთიერთობა, ან არანაირი ურთიერთობა. თუ გრეხილი ხაზი მარტივი წრფივი რეგრესიით არის ბინა (არ არის sloped), არ არსებობს ურთიერთობა ორ ცვლადს შორის. თუ რეგრესიული ხაზი გრაფის ქვედა ბოლოს იკავებს გრაფის შიგნით (ღერძი) და გრაფის ველში მოქცეული ხაზის ზედა ხაზი, დაშორება x ინტერვენცია (ღერძი), დადებითი ხაზოვანი ურთიერთობა არსებობს . თუ რეგრესიული ხაზი გრაფის ზედაპირის ზედა ნაწილში ქვევით, გრაფის შიგნით და ღერძებისკენ მიმავალი ხაზის ქვედა ბოლოს, ქვედა ხაზის გასწვრივ, გრაფის დერეფანში, x ინტერვენციის მიმართ (ღერძი), უარყოფითი ხაზოვანი ურთიერთობა არსებობს.
სავარაუდო ხაზოვანი რეგრესიის განტოლება
თუ მოსახლეობის პარამეტრების ცნობილია, მარტივი ხაზოვანი რეგრესიის განტოლება შეიძლება გამოყენებულ იქნას x- ის ცნობილი ღირებულებისთვის y- ის საშუალო მნიშვნელობის გამოთვლაში.
Ε ( ი ) = ( β 0 + β 1 x ).
თუმცა, პრაქტიკაში, პარამეტრის ღირებულებები არ არის ცნობილი, ამიტომ ისინი უნდა შეფასდეს მოსახლეობის ნიმუშის მონაცემების გამოყენებით. მოსახლეობის პარამეტრები შეფასებულია სტატისტიკური მონაცემების გამოყენებით . ნიმუშების სტატისტიკა წარმოდგენილია b 0 + b 1. როდესაც ნიმუშების სტატისტიკა შეიცვალა მოსახლეობის პარამეტრებისათვის, ჩამოყალიბებულია რეგრესიული განტოლება.
ქვემოთ ჩამოთვლილია რეგრესიული განტოლება.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) არის გამოხატული y ქუდი .
სავარაუდო მარტივი რეგრესიის განტოლების გრაფიკი ეწოდება სავარაუდო რეგრესიის ხაზს.
B 0 არის y intercept.
B 1 არის ფერდობზე.
Ŷ ) არის x- ის მნიშვნელობაზე y- ის სავარაუდო ღირებულება.
მნიშვნელოვანი შენიშვნა: რეგრესიული ანალიზი არ გამოიყენება ცვლადების შორის მიზეზ-შედეგობრივი ურთიერთობების ინტერპრეტაციისთვის. თუმცა, რეგრესიული ანალიზის საშუალებით შეიძლება მიუთითოს, თუ როგორ არის დაკავშირებული ცვლადები ან რამდენად არის დაკავშირებული ცვლადები ერთმანეთთან.
ამგვარად, რეგრესიული ანალიზი ცდილობს, გააღრმავოს ურთიერთობები, რომელიც უფრო მჭიდროდ იცნობა მცოდნე მკვლევარებს.
ასევე ცნობილია, როგორც: bivariate რეგრესია, რეგრესიული ანალიზი
მაგალითები: არასაკმარისი სკვერების მეთოდი არის სტატისტიკური პროცედურა ნიმუშის მონაცემების გამოყენებისათვის სავარაუდო რეგრესიის განტოლების ღირებულების დასადგენად. ნაკლებად სკვერების მეთოდი შემოთავაზებული იყო კარლ ფრიდრიხ გუსსით, რომელიც დაიბადა 1777 წელს და გარდაიცვალა 1855 წელს. არასაკმარისი სკვერების მეთოდი კვლავ ფართოდ გამოიყენება.
წყაროები:
ანდერსონი, DR, შვეიცარია, DJ და უილიამსი, TA (2003). ბიზნესისა და ეკონომიკის სტატისტიკის საფუძვლები (მე -3 გამოცემა) მეისონი, ოჰაიო: სამხრეთ-დასავლეთ, ტომპსონი სწავლა.
______. (2010). ახსნა: რეგრესიული ანალიზი. MIT ამბები.
McIntyre, L. (1994). სიგარეტის მონაცემების გამოყენება მრავალჯერადი რეპრესიების შესავლად. სტატისტიკის ჟურნალი, 2 (1).
მენდენჰალი, ვ. და სინკიჩი, თ. (1992). სტატისტიკა საინჟინრო და მეცნიერებათა (მე -3 გამოცემა), New York, NY: Dellen Publishing Co.
პანჩენკო, დ. 18.443 სტატისტიკა განაცხადების, 2006 წლის შემოდგომა, სექცია 14, მარტივი ხაზოვანი რეგრესია. (მასაჩუსეტსის ტექნოლოგიური ინსტიტუტი: MIT OpenCourseWare)