UTF-8
UTF-8 (تنسيق تحويل Unicode 8 بت)
ترميز الأحرف المهيمن على الويب، القادر على تمثيل كل حرف في معيار Unicode باستخدام بايت واحد إلى أربعة بايتات لكل حرف مع الحفاظ على التوافق مع ASCII.
التفاصيل التقنية
UTF-8 ترميز متغير العرض: أحرف ASCII (U+0000 إلى U+007F) تستخدم بايت واحد مطابق لقيم ASCII مما يجعل أي نص ASCII صالحاً كـ UTF-8. بايتان يغطيان اللاتينية واليونانية والسيريلية والعربية (U+0080-U+07FF)، ثلاثة بايتات تغطي معظم أحرف CJK (U+0800-U+FFFF)، وأربعة بايتات تتعامل مع الرموز التعبيرية والنصوص النادرة (U+10000-U+10FFFF). أكثر من 98% من صفحات الويب تستخدم UTF-8. علامة ترتيب البايت (BOM، EF BB BF) اختيارية وغير مستحبة عموماً إلا في سياقات Windows.
مثال
```javascript
// UTF-8: file processing example
const file = document.getElementById('fileInput').files[0];
const reader = new FileReader();
reader.onload = (e) => {
const data = e.target.result;
console.log(`Loaded: ${file.name} (${file.size} bytes)`);
};
reader.readAsArrayBuffer(file);
```