Куда катится этот мир?

RU-CENTER

Что, как и зачем

Вкратце

Технология

Обработанные выборки. «Рунет»

Обработанные выборки. «Общемировой веб»

Исследуемые особенности стороны сервера

Исследуемые особенности стороны клиента

Объекты исследования

Принципы анализа HTML-кода

  1. Простейший tokenizer (как это по-русски?..) последовательно проходит HTML-код и разделяет его на составляющие
  2. Интересные вхождения внутрь этих составляющих детектируются при помощи регулярных выражений

StackOverflow:

«Всякий раз, когда ты пытаешься парсить HTML регулярными выражениями, сын нечестивый умывается кровью девственниц, и русские хакеры павнят твое веб-приложение»

Пара слов об общей картине

Откликнувшиеся веб-узлы

100% 0%

.RU, 79%

.COM, 67%

Alexa, 86%

Обнаружения одной из популярных CMS

40% 0%

.RU, 29%

.COM, 10%

Alexa, 25%

Популярные CMS, .RU

50% 0%

Dru­pal, 7%

Word­Press, 38%

Joom­la!, 38%

MODx, 5%

«1С-Бит­рикс», 9%

UMI.CMS, 2%

NetCat, 1%

Популярные CMS, .COM

100% 0%

Dru­pal, 4%

Word­Press, 78%

Joom­la!, 17%

MODx, 0%

«1С-Бит­рикс», 0%

UMI.CMS, 0%

NetCat, 0%

Популярные CMS, Alexa

100% 0%

Dru­pal, 9%

Word­Press, 74%

Joom­la!, 14%

MODx, 1%

«1С-Бит­рикс», 2%

UMI.CMS, 1%

NetCat, 0%

Доктайпы и режимы рендеринга

Доктайпы как таковые

100% 0%

.RU, 82%

.COM, 64%

Alexa, 90%

Standards-Mode-доктайпы

100% 0%

.RU, 71%

.COM, 56%

Alexa, 83%

Разновидности доктайпов, .RU

50% 0%

HTML5, 15%

HTML 4.01 (SM), 7%

XHTML 1.0 Strict, 10%

XHTML 1.0 Transi­tional, 37%

XHTML 1.1, 1%

HTML 4.0/4.01 (QM), 7%

Другой, 4%

Никакой, 18%

Разновидности доктайпов, .COM

50% 0%

HTML5, 11%

HTML 4.01 (SM), 8%

XHTML 1.0 Strict, 9%

XHTML 1.0 Transi­tional, 26%

XHTML 1.1, 1%

HTML 4.0/4.01 (QM), 5%

Другой, 5%

Никакой, 36%

Разновидности доктайпов, Alexa

50% 0%

HTML5, 21%

HTML 4.01 (SM), 6%

XHTML 1.0 Strict, 11%

XHTML 1.0 Transi­tional, 43%

XHTML 1.1, 1%

HTML 4.0/4.01 (QM), 4%

Другой, 3%

Никакой, 10%

Рост распространенности доктайпа HTML5, .RU

15% 10%

, 10,11%

, 11,15%

, 12,06%

, 12,82%

, 13,77%

, 14,96%

Прирост в абсолютных цифрах — почти 140 тысяч!

HTML5 завоевывает планету

Новые структурные элементы HTML5

<article>, <aside>, <audio>, <bdi>, <canvas>, <command>, <datalist>, <details>, <figcaption>, <figure>, <footer>, <header>, <hgroup>, <keygen>, <mark>, <math>, <meter>, <nav>, <output>, <progress>, <rp>, <rt>, <ruby>, <section>, <source>, <summary>, <svg>, <time>, <track>, <video>

Новые структурные элементы HTML5. Распространенность

15% 0%

.RU, 7%

.COM, 5%

Alexa, 13%

Рост распространенности новых элементов HTML5, .RU

8% 4%

, 4,43%

, 4,86%

, 5,47%

, 6,13%

, 6,77%

, 7,47%

Прирост в абсолютных цифрах — более 80 тысяч

Новые типы полей ввода HTML-форм

Новые типы полей ввода HTML-форм. Распространенность

15% 0%

.RU, 4%

.COM, 3%

Alexa, 12%

«Проблемные» конструкции HTML

1. Опротестованные

Объявлены как deprecated в спецификации HTML 4.01 и в итоге упразднены в HTML5

Опротестованные элементы

<applet>, <basefont>, <center>, <dir>, <font>, <isindex>, <strike>

Опротестованные элементы. Распространенность

50% 0%

.RU, 31%

.COM, 19%

Alexa, 33%

Опротестованные атрибуты

Опротестованные атрибуты. Продолжение

2. Упраздненные

Не объявлены как deprecated, но в итоге все же исключены из HTML5

Упраздненные элементы

Упраздненные атрибуты

3. Реабилитированные

Объявлены как deprecated, но в итоге восстановлены в HTML5 в каком-либо новом качестве

Реабилитированные элементы

Реабилитированные атрибуты

4. Фреймовые

Актуальны только в документах типа Frameset и не используются в HTML5

Фреймовые элементы

<frame>, <frameset>, <noframes>

Фреймовые элементы. Распространенность

15% 0%

.RU, 1%

.COM, 12%

Alexa, 1%

Почти 3% сайтов в доменах .COM имеют честные Frameset-доктайпы

Фреймовые атрибуты

5. Нестандартные

Не описаны ни в одной из официальных спецификаций HTML

Нестандартные элементы

<bgsound>, <blink>, <comment>, <marquee>, <multicol>, <nobr>, <noembed>, <noindex>, <plaintext>, <spacer>, <xmp>

Нестандартные элементы. Распространенность

20% 0%

.RU, 17%

.COM, 2%

Alexa, 8%

Нестандартные атрибуты

6. Легитимизированные

Изначально нестандартные, «узаконены» в HTML5

Легитимизированные элементы

Использование CSS

CSS в любом виде

100% 0%

.RU, 93%

.COM, 63%

Alexa, 95%

Внешние таблицы стилей

100% 0%

.RU, 82%

.COM, 48%

Alexa, 87%

Таблицы стилей внутри HTML-кода

100% 0%

.RU, 39%

.COM, 33%

Alexa, 50%

Inline-стили

100% 0%

.RU, 79%

.COM, 46%

Alexa, 84%

Интересные частности

Метатеги viewport

15% 0%

.RU, 5%

.COM, 8%

Alexa, 13%

Теме посвящен доклад «Прокрустовы окна»

Рост распространенности метатегов viewport, .RU

5% 2%

, 2,60%

, 3,12%

, 3,55%

, 3,88%

, 4,37%

, 4,84%

Прирост в абсолютных цифрах — почти 60 тысяч

Условные комментарии для IE

50% 0%

.RU, 34%

.COM, 16%

Alexa, 42%

БЭМ-классы

Кодировка UTF-8

100% 0%

.RU, 50%

.COM, 51%

Alexa, 54%

Концепты сайтов

Сайты будущего

Сайты будущего. Распространенность

1% 0%

.RU, 0,57%

.COM, 0,77%

Alexa, 0,57%

Абсолютное количество таких сайтов в доменах .RU — 13970

Современные сайты

Современные сайты. Распространенность

3% 0%

.RU, 2,6%

.COM, 2,5%

Alexa, 1,8%

Сайты разных эпох, сделанные с оглядкой на стандарты

Сайты разных эпох, сделанные с оглядкой на стандарты. Распространенность

10% 0%

.RU, 8%

.COM, 7%

Alexa, 8%

Сайты темного прошлого

Сайты темного прошлого. Распространенность

40% 0%

.RU, 22%

.COM, 36%

Alexa, 12%

Дальнейшее чтение

«Мониторинг серверных и клиентских веб-решений» — подробнейший отчет о результатах исследований, включающий почти 40 тысяч знаков текста и более 20 диаграмм

Спасибо! Вопросы?

Презентация: lomov.ru/wsd