Thursday, August 16, 2012

تردد الحروف العربية

أستعملت ثلاثة مقالات، واحدة من ويكيبيديا وواحدة من الجزيرة وواحدة من الأهرام، بمجموع حوالي 22 ألف حرف عربي، لحساب التردد النسبي للحروف العربية. هذا التقدير تقريبي وغير صالح لأي أستخدام علمي، وإنما هو مجرد إشارة.
{ا,إ,أ,آ,ى}→0.181314
ل→0.109845
{ي,ئ}→0.0855272
{ت,ة}→0.0805501
م→0.0645274
ر→0.0538747
{و,ؤ}→0.0534381
ن→0.0475879
د→0.0366732
ب→0.0361493
ع→0.0327876
س→0.0265881
ق→0.0223969
ف→0.0222659
ح→0.0212181
ه→0.0188605
ك→0.0178127
ص→0.0142327
{ج,چ}→0.0137088
ش→0.0109146
خ→0.00912465
ث→0.00873172
ط→0.00868806
ز→0.00563196
ض→0.00554464
ذ→0.00497708
ظ→0.00340537
غ→0.00336171
Spikey Created with Wolfram Mathematica 8.0


ثم نزلت القرآن من موقع تنزيل.نت وحسبت تردد الحروف فوجدت الآتي:
إاىآأ0.186902
ل0.11609
ن0.0822685
م0.0813341
ؤو0.076572
ئي0.0699051
ه0.0449529
ةت0.0386495
ر0.0379375
ب0.0348609
ك0.031538
ع0.0282571
ف0.0262801
ق0.0211335
س0.0183994
د0.0179998
ذ0.0148181
ح0.0131115
ج0.00996584
خ0.00750217
ش0.0063815
ص0.00622527
ض0.00506554
ز0.00480415
ء0.00474106
ث0.00424833
ط0.00382469
غ0.00366846
ظ0.00256282
چ