Разлика између УЦС-2 и УТФ-16

УЦС-2 вс УТФ-16

УЦС-2 и УТФ-16 су две схеме кодирања знакова које користе 2 бајта, који се састоји од 16 бита, да би представили сваки знак; дакле 2 и 16 суфикса. Главна разлика између УЦС-2 и УТФ-16 је та која се користи данас. УЦС-2 је старија шема која се од тада сматра застарелом и замењена је много новијом и моћнијом УТФ-16.

УЦС-2 је кодирање фиксне ширине која користи два бајта за сваки знак; што значи, може представљати укупно 216 знакова или нешто више од 65 хиљада. С друге стране, УТФ-16 је шема кодирања променљиве ширине која користи најмање 2 бајта и максимално 4 бајта за сваки знак. Ово омогућава УТФ-16 да представља било који знак у Уницоде-у, док користи минимални простор за најчешће коришћене знакове. За већину од 65.000+ знакова, УЦС-2 и УТФ-16 имају идентичне кодне тачке; па су у великој мери једнаки. Ово омогућава УТФ-16 апликацијама да правилно интерпретирају УЦС-2 кодове. Али обрнуто не би успело због многих побољшања УТФ-16.

Једно од наведених побољшања је могућност представљања скрипти које иду с десна на лево, а не с лева на десно. У УТФ-16 скрипте могу идентификовати усмереност, на тај начин омогућавајући апликацији да правилно исправи речи које су сачуване у коду. УЦС-2 недостаје ова способност, па неће радити са скриптама попут арапског и хебрејског, које се крећу с десна на лево. Још једна карактеристика коју УТФ-16 има је нормализација. Нормализација третира речи које значе исту ствар, али су различито представљене као идентичне. На примјер, ријечи "не могу" и "не могу" су идентичне јер је ово само скраћење првог. Ово је веома важно, посебно када тражите такве речи, јер би то омогућило свеобухватнији резултат претраживања. У УЦС-2 се то не дешава аутоматски, па апликација такву функцију мора сама имплементирати.

Заправо нема разлога да одаберете УЦС-2 преко УТФ-16, осим што немате апликацију за коју не треба да подржавате УТФ-16. У свим аспектима УТФ-16 је супериорнији од УЦС-2. Такође је увелико компатибилан уназад, тако да не морате бринути о датотекама кодираним у УЦС-2.

Резиме:

  1. УЦС-2 је застарео и од тада је замењен са УТФ-16
  2. УЦС-2 је шема кодирања фиксне ширине док је УТФ-16 схема кодирања промјењиве ширине
  3. УТФ-16 способне апликације могу да читају УЦС-2 датотеке, али не и обрнуто
  4. УТФ-16 подржава право давања скрипти док УЦС-2 не
  5. УТФ-16 подржава нормализацију док УЦС-2 не