Nasıl çalışır?
Kelime sayımı, /\s+/ regex'iyle yapılan bölme işleminin sonucundaki boş olmayan parçaları sayar. Karakter sayımları: Boşluklu → string.length Boşluksuz → string.replace(/\s/g, "").length UTF-8 byte → TextEncoder().encode(s).length
Sıkça sorulan sorular
- Türkçe karakterler kaç byte sayılır?
- ş, ü, ç gibi karakterler UTF-8'de 2 byte yer kaplar. Bu yüzden 'ş' tek karakterdir ama byte sayımı bunu 2 olarak gösterir; bu fark dosya boyutu hesabında önemlidir.
- Tweet karakter sınırı için hangi sayımı kullanmalıyım?
- Twitter/X karakter sınırı UTF-16 code unit'lerine göre değil, 'weighted character' adlı kendi sayım sistemiyle hesaplar. Bu hesaplayıcı kabaca eşdeğer karakter sayımı verir; emoji ağırlıklı metinlerde küçük farklar olabilir.