Разлика између УТФ-8 и УТФ-16

УТФ-8 вс УТФ-16

УТФ означава Уницоде Трансформатион Формат. То је породица стандарда за кодирање знака Уницоде у његову еквивалентну бинарну вредност. УТФ је развијен тако да корисници имају стандардизована средства за кодирање знакова с минималном количином простора.УТФ-8 и УТФ 16 само су два од утврђених стандарда за кодирање. Разликују се само по томе колико бајтова користе за кодирање сваког знака. Будући да су оба кодирања промјењиве ширине, могу користити до четири бајта за кодирање података, али када дође до минимума, УТФ-8 користи само 1 бајт (8бит), а УТФ-16 користи 2 бајта (16бит). Ово има огроман утицај на резултирајућу величину кодираних датотека. Када се користе само АСЦИИ знакови, УТФ-16 кодирана датотека била би отприлике двоструко већа од исте датотеке кодиране с УТФ-8.

Главна предност УТФ-8 је та што је назад компатибилан са АСЦИИ. АСЦИИ скуп знакова је фиксне ширине и користи само један бајт. Код кодирања датотеке која користи само АСЦИИ знакове с УТФ-8, резултирајућа датотека би била идентична датотеци кодираној с АСЦИИ. Ово није могуће када користите УТФ-16 јер би сваки знак био дуг два бајта. Наслијеђени софтвер који није свјестан Уницоде-а не би могао отворити УТФ-16 датотеку чак и ако има само АСЦИИ знакове.

УТФ-8 је бајтовски оријентисан формат и зато нема проблема са бајт-оријентисаним мрежама или датотеком. УТФ-16, с друге стране, није оријентисан бајтом и треба да успостави редослед бајтова како би радио са бајт-оријентисаним мрежама. УТФ-8 је такође бољи у опоравку од грешака које оштећују делове датотеке или тока јер још увек може декодирати следећи некоришћени бајт. УТФ-16 ради потпуно исту ствар ако су неки бајтови оштећени, али проблем лежи када се неки бајти изгубе. Изгубљени бајт може да помеша следеће комбинације бајтова, а крајњи резултат би могао да се постигне.

Резиме:
1. УТФ-8 и УТФ-16 користе се за кодирање знакова
2. УТФ-8 користи најмање један бајт за кодирање знакова, док УТФ-16 користи два
3. УТФ-8 кодирана датотека обично је мања од УТФ-16 кодиране датотеке
4. УТФ-8 је компатибилан са АСЦИИ, док је УТФ-16 некомпатибилан са АСЦИИ
5. УТФ-8 је бајт оријентисан док УТФ-16 није
6. УТФ-8 је бољи у опоравку од грешака у поређењу са УТФ-16