معرفة
منصة تعليم الكترونية
(R language) لغة آر
هي لغة وبيئة للحوسبة الإحصائية والرسوم البيانية. يعمل على مجموعة متنوعة من المنصات، لغة برمجة مفتوحة المصدر، متاح كبرنامج مجاني. توفر لغة آر مجموعة متنوعة من الأساليب الإحصائية ومنها النمذجة الخطية والغيرخطية، الاختبارات الإحصائية الكلاسيكية، تحليل السلاسل الزمنية، التصنيف، التجميع، والتقنيات الرسومية
لماذا نستخدم لغة آر؟
.١- لأنها مجانية ومفتوحة المصدر
Windows, Linux, Mac : ٢- تعمل على
.٣- يمكن تحويل كود من لغة آر بسهولة من منصة إلى أخرى
: ٤- تربط قواعد البيانات المختلفة بفاعلية مثل
Oracle, SQLite, MySQL, Microsoft Access.
كيفية تحميل برنامج آر
: ١-ادخل الرابط التالي
https://cran.r-project.org/mirrors.html
٢-اختار الدولة الأقرب لك
٣-اختر الرابط المخصص لنظام التشغيل لديك
٤-قم بتحميل آخر إصدار
.٥- قم بتثبيت البرنامج على جهازك
: تحميل برنامج آر ستوديو
: ١-ادخل الرابط التالي
https://rstudio.com/products/rstudio/download/
٢-اختر الإصدار الخاص بك بالجهاز المكتبي
٣-اختر الاصدار المجاني والمفتوح
٤-قم باختيار آخر إصدار من آر ستوديو.
: أساسيات لغة آر
: استخدام آر كآلة حاسبة
١- < في بداية السطر هو موجه آر يطهر تلقئيا
٢-تشير [١] إلى الإجابة الأولى على هذا السطر
٣-أي نص تتبعه # هو تعليق ولا يتم تشغيله بواسطة آر
٤-يعرض آر بشكل افتراضي سبعة أرقام في الحسابات
: ويمكن تغيير ذلك بواسطة
options(digits=d)#where d is the desired number of digits
2+2 : ٥-في أبسط أشكاله، يمكن استخدام آر كآلة حاسبة بسيطة مثل
: المتغيرات
١-يسمى المفهوم الأساسي في البرمجة(الإحصائية) المتغير
٢-يسمح لك المتغير بتخزين قيمة (مثل ٢) أاو كائن في آر
٣-يجب أن تبدأ أسماء المتغيرات بحرف
٤-عامل التخصيص التقليدي في آر هو <- (عامل السهم) أو = لكن يوصى بالسهم بالغالب
٥-آر حساسة لحالة الزحرف، لذا فالحرف الكابيتال والحرف السمول تعتبر متغيرات مختلفة
: مثال
x <- 2 ; X=3 ; x+X
: أنواع البيانات في آر
هناك العديد من أنواع البيانات في آر. الأنواع الرئيسية : للبيانات التي يرجح استخدامها
: البيانات العددية
القيم العشرية مثل ٤.٥ أو الأرقام الطبيعية مثل ٤
: البيانات النصية
: يتم تمثيلها بالأحرف أو سلسلة من الأحرف بين علامة الإقتباس الفردية أو الزوجية
y<-"Hello World“ ; y : مثل
: البيانات المنطقية
التعبيرات المنطقية(القيم المنطقية) هي طريقة لتمثيل البيانات التي يمكن أن تكون إما صحيح أو خطأ. عدديا الصحيح هو نفسخ ١ و الخاطئ هو نفسه ٠
: المساعدة في آر
: للعثور على معلومات حول دالة ومعلماتها في آر
١-للحصول على تعليمات حول الوظيفة
ستعطيك تفسيرات شاملة حول أي وظيفة، أيضا اسبق الوظيفة ب ؟ في وحدة التحكم للحصول على المساعدة
help(plot)
?sum
يفتح نافذة جديدة مع نص مساعدة.
اختبار البيانات المُحتوية على مُدخلات ناقصة
للعثور على البيانات الناقصة في قاعدة البيانات بإمكانك ااستخدام الطريقة التالية:
لمعرفة ما إذا كانت البيانات تحتوي على مدخلات ناقصة استخدم (الميثود) التالية:
#check missing values
complete.cases(x)
ولإزالة هذه البيانات الناقصة استخدم:
#remove missing value
comletedata=na.omit(x)
ولمعرفة الأجزاء التي يوجد بها بيانات ناقصة تُستخدم (الميثود) الآتية:
which(is.na(x))
في هذا (الكود) بإمكانك تجربة اكتشاف أماكن البيانات الناقصة, فقط قُم بوضع بياناتك في المتغير (اكس), وستظهر لديك النتائج
#put your data in x
x = read.csv("yourdataset/train.csv")
#to find the missing values:
print("Missing value at index: ")
which(is.na(x))
..