Скачать .docx |
Реферат: Компьютерные системы и коммуникации
Министерство образования и науки Украины
Киевская государственная академия водного транспорта
имени гетмана Петра Конашевича-Сагайдачного
Компьютерные системы и коммуникации
Килия – 2009
1. Система World Wide Web
Всеми́рная паути́на (англ. World Wide Web) — распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом. Для загрузки и просмотра web-страниц используются специальные программы – браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же. Для обозначения Всемирной паутины также используют слово веб (англ. web) и «WWW».
Структура и принципы Всемирной паутины
Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенных по всему миру. Веб-сервер является программой, запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически распределять ресурсы в ответ на HTTP-запрос. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform Resource Identifier). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён DNS (англ. Domain Name System) — доменное имя (или непосредственно IP-адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее — одного из его сетевых интерфейсов), который исполняет код нужного веб-сервера.
Для обзора информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа — веб-браузер. Основная функция веб-браузера — отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссы́лки. Большая часть информации в Вебе представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language), язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, ма́стера по разметке называют веб-мастером или вебмастером (без дефиса). После HTML-разметки получившийся гипертекст помещается в файл, такой HTML-файл является самым распространённым ресурсом Всемирной паутины[источник?] . После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт. В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки веба основаны на технологии URL.
Технологии Всемирной паутины
В целом можно заключить, что Всемирная паутина стоит на «трёх китах»: HTTP, HTML и URL. Хотя в последнее время HTML начал несколько сдавать свои позиции и уступать их более современным технологиям разметки: XHTML и XML. XML (англ. eXtensible Markup Language) позиционируется как фундамент для других языков разметки. Для улучшения визуального восприятия веба стала широко применяться технология CSS, которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, — система обозначения ресурсов URN (англ. Uniform Resource Name).
Популярная концепция развития Всемирной паутины — создание семантической паутины. Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина — это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования. Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области — это RDFS (англ. RDF Schema) и SPARQL (англ. Protocol And RDF Query Language) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.
История Всемирной паутины
Изобретателями всемирной паутины считаются Тим Бернерс-Ли в меньшей степени, Роберт Кайо. Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр» (англ. «Enquire», можно вольно перевести как «Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины.
В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли (совместно с его помощниками) были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год.
В рамках проекта Бернерс-Ли написал первый в мире веб-сервер «httpd» и первый в мире гипертекстовый веб-браузер, называвшийся «WorldWideWeb». Этот браузер был одновременно и WYSIWYG-редактором (сокр. от англ. What You See Is What You Get — что видишь, то и получишь), его разработка была начата в октябре 1990 года, а закончена в декабре того же года. Программа работала в среде «NeXTStep» и начала распространяться по Интернету летом 1991 года.
Первый в мире веб-сайт Бернерс-Ли создал по адресу http://info.cern.ch/, теперь сайт хранится в архиве. Этот сайт появился он-лайн в Интернете 6 августа1991 года. На этом сайте описывалось, что такое Всемирная паутина, как установить веб-сервер, как использовать браузер и т. п. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.
На первой фотографии во Всемирной паутине была изображена пародийная филк-группа Les Horribles Cernettes.[1] Тим Бернес-Ли попросил их отсканированные снимки и лидера группы после CERN Hardronic Festival.
И всё же теоретические основы веба были заложены гораздо раньше Бернерса-Ли. Ещё в 1945 году Ванна́вер Буш разработал концепцию «Memex» — вспомогательных механических средств «расширения человеческой памяти». Memex — это устройство, в котором человек хранит все свои книги и записи (а в идеале — и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Оно является расширением и дополнением памяти человека. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути ко Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).
С 1994 года основную работу по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (англ. World Wide Web Consortium, W3C), основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. Данный Консорциум — организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: «Полностью раскрыть потенциал Всемирной паутины путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». Две другие важнейшие задачи Консорциума — обеспечить полную «интернационализа́цию Сети́» и сделать Сеть доступной для людей с ограниченными возможностями.
W3C разрабатывает для Интернета единые принципы и стандарты (называемые «Рекоменда́циями», англ. W3C Recommendations), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все Рекомендации Консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.
Перспективы развития Всемирной паутины
В настоящее время наметились две тенденции в развитии Всемирной паутины: семантическая паутина и социальная паутина. Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных. Социальная паутина полагается на работу по упорядочиванию имеющейся в Паутине информации, выполняемую самими пользователями Паутины. В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (RSS и другие форматы веб-каналов, OPML, микроформаты XHTML).
Существует также популярное понятие Web 2.0, обобщающее сразу несколько направлений развития Всемирной паутины.
Способы активного отображения информации во Всемирной паутине
Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно — тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:
· гостевые книги,
· форумы,
· чаты,
· блоги,
· wiki-проекты,
· системы управления контентом.
Следует отметить, что это деление весьма условно. Так, скажем, блог или гостевую книгу можно рассматривать как частный случай форума, который, в свою очередь, является частным случаем системы управления контентом. Обычно разница проявляется в назначении, подходе и позиционировании того или иного продукта.
Отчасти информация с сайтов может также быть доступна через речь. В Индии уже началось[2] тестирование системы, делающей текстовое содержимое страниц доступным даже для людей, не умеющих читать и писать.
Организации, занимающиеся развитием Всемирной паутины и Интернета в целом
· World Wide Web Consortium, W3C
· The Internet Engineering Task Force, IETF
· Internet Society, ISOC
· International Organization for Standardization, ISO
· Web Standards Group, WSG
· The Web Standards Project
· Unicode Organization
· The Semantic Web Community Portal
Ссылки
· Официальный сайт Консорциума Всемирной паутины
· Знаменитая книга Бернерса-Ли «Плетя паутину: истоки и будущее Всемирной паутины» он-лайн на английском языке
· Историческое предложение Тима Бернерса-Ли для CERN
· Первый в мире веб-сайт (архив)
Многие подходят к рекламе, как к написанию текстов. Литературные дарования имеют к рекламе отношение, не более, чем ораторское искусство к искусству личной продажи.
Клод Хопкинс
Электронная реклама, размещаемая в интернете:
Медийная реклама — размещение текстово-графических рекламных материалов на сайтах, представляющих собой рекламную площадку. По многим признакам аналогична рекламе в печатных СМИ. Однако, наличие у баннера гиперссылки и возможность анимированного изображения значительно расширяют возможности воздействия медийной рекламы. Как правило, медийная реклама имеет форму баннерной рекламы.
Контекстная реклама — размещение текстово-графических рекламных материалов рядом с результатами поиска на сайтах, предлагающих пользователю функцию поиска. Демонстрация тех или иных рекламных сообщений зависит от поискового запроса пользователя. Как правило, поисковая реклама имеет форму текстовой рекламы.
Другие виды рекламы в интернете как правило совмещают признаки медийной и поисковой рекламы или же переносят эти признаки в смежные с размещением на интернет-страницах области: так, видами интернет-рекламы считаются размещение рекламы в рассылках по подписке и размещение рекламы в клиентах программ, установленных на рабочей станции пользователя.
C использованием E-mail
Электронная почта (Electronic mail, e-Mail) — сетевая служба, позволяющая пользователям обмениваться сообщениями или документами без применения бумажных носителей. Преимущества использования e-mail для доставки рекламных сообщений:
• электронная почта есть практически у всех пользователей Сети;
• e-mail представляет собой push-технологию вещания;
• дает возможность персонифицированного обращения;
• интересное, с точки зрения получателя, сообщение может быть распространено им среди его коллег и знакомых;
Для продвижения с помощью e-mail используются следующие основные методы:
· Рассылки подписчикам (mailing lists, "opt-in" E-mail marketing) — В Интернете существует множество списков рассылки, которые посвящены различным тематикам. Получатели подобных писем собственноручно подписались на рассылку, и в любой момент у них есть право и возможность отменить свою подписку. Существуют открытые рассылки (для всех желающих), закрытые (для людей определенного круга), бесплатные (существующие за счет энтузиазма создателей, спонсорской поддержки, платных рекламодателей), платные. Так как список рассылки обычно представляет собой средство вещания для определенной целевой группы и часто имеет тысячи подписчиков, он является эффективным инструментом маркетинга. Ряд компаний на своих официальных сайтах предлагает посетителям подписаться на рассылку, информирующую о новостях компании и обновлениях сайта. Данная рассылка напоминает подписчикам о сайте и бизнесе его владельца, информируя и стимулируя повторные визиты.
· Размещение рекламы в новостных рассылках — значительное число рассылок подписчикам имеет новостной характер и функционирует аналогично СМИ, получая доход в том числе от размещения рекламы. Реклама в рассылках как правило аналогична баннерной рекламе в Интернете, с отличием по способу ограничения целевой аудитории: социально-демографические параметры и интересы аудитории могут зависеть не только от тематики рассылок, но и от данных анкеты подписчика.
· Несанкционированная рассылка
o Спам — массовая рассылка рекламных объявлений по электронной почте без согласия получателей. Рассылка спама считается нарушением этикета и правил применения компьютерных сетей. Специфичность этого вида интернет-продвижения состоит не в анонимности рекламораспространителя и не в том, что спам — незапрошенная рассылка (многие виды рекламы являются незапрошенными или «несанкционированными», многие — анонимными). Особенность спама в том, что основную часть затрат по доставке рекламы несут потребители и интернет-провайдеры, тогда как источник спама ничем не компенсирует им доставку сообщений. По данному признаку спам не является рекламой, поскольку реклама по определению использует платные каналы доведения сообщения до аудитории. Спам преследуется или ограничивается законодательством ряда стран.
o Индивидуальные письма: рассылка индивидуальных писем по электронной почте — инструмент директ-маркетинга, требующий времени и персонализации сообщений. Ему предшествует работа по сбору адресов. С другой стороны, письмо попадает именно тем представителям аудитории, в чьем внимании инициатор рассылки в наибольшей степени заинтересован.
Поисковая оптимизация (SEO — Search engine optimization)
Для некоторых типов сайтов поисковики приносят до половины и больше всех посетителей (то есть, потенциальных клиентов). Необходимым условием этого является присутствие ссылки в первых строках результатов поиска по наиболее популярным запросам. Поскольку результаты поиска обычно отсортированы по релевантности, перед оптимизатором стоит задача повысить релевантность кода веб-страниц к наиболее распространённым поисковым запросам.
Всплывающие (pop-up) окна и spyware
Аналогично спаму, для распространения используются ресурсы потребителя. Но метод не столь дёшев, как спам. К тому же, spyware во многих случаях признаётся вредоносной программой.
Просмотр рекламы за плату или подписка на рекламу
Этот метод не показал особой эффективности в сравнении с другими и в настоящее время используется мало.
Электронная доска объявлений
Сайт, по содержанию вполне аналогичный обычным бытовым доскам объявлений или рекламным газетам. Качественно отличается от них высокой оперативностью обновления содержимого и глобальной доступностью. Особым видом интернет рекламы совмещающий электронные доски объявлений и электронные карты является способ описанный в статье реклама на карте.
Регистрация в каталогах
Этот вид рекламы также не очень специфичен для Интернета — в офлайне тоже есть каталоги и справочники, внесение в которые даёт свою долю клиентов. Интернет-каталоги отличаются от офлайновых своим количеством, которое, возможно, уже перешло в качество. На данный момент регистрация в каталогах не является успешным методом продвижения, так как поисковые системы могут анализировать откуда ведет ссылка. Таким образом ссылки ведущие из каталогов приносят лишь небольшой процент в рейтинг сайта.
Участие в рейтингах
Для некоторых сайтов этот метод приносит существенную часть клиентов. Для большинства — незначительную часть. К тому же, не существует добросовестных способов подняться в рейтинге за деньги. Поэтому данный способ не укладывается в типовую экономическую схему «деньги-реклама-клиенты-деньги». Тем не менее, его с натяжкой можно отнести к методам рекламы.
Реферальные и партнёрские программы
Хотя подобные методы рекламы и маркетинга (см., например, MLM) давно известны в офлайне, в Интернете несравненно удобнее учитывать рефералов и привлечённых клиентов. Поэтому можно сказать, что данный метод получил в Интернете новую жизнь.
Правовое регулирование
Традиционные правовые нормы о рекламе не всегда могут эффективно регулировать электронные рекламы, поскольку:
· эти нормы не учитывают технические особенности сети Интернет;
· затруднено определение юрисдикции (законодательство какой территории применять);
· затруднён контроль и привлечение к ответственности нарушителей.
Последние годы в законодательстве разных стран появляются специализированные нормы, регулирующие рекламу в Интернете.
3. Язык HTML
HTML (от англ. HyperText Markup Language — «язык разметки гипертекста») — стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц создаются при помощи языка HTML (или XHTML). Язык HTML интерпретируется браузером и отображается в виде документа, в удобной для человека форме.
HTML является приложением SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879.
Общее представление
Язык HTML был разработан британским учёным Тимом Бернерсом-Ли приблизительно в 1991—1992 годах в стенах Европейского совета по ядерным исследованиям в Женеве (Швейцария). HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. HTML успешно справлялся с проблемой сложности SGML путём определения небольшого набора структурных и семантических элементов (размечаемых «тегами»), служащих для создания относительно простых, но красиво оформленных документов. Помимо упрощения структуры документа, в HTML внесена поддержка гипертекста. Мультимедийные возможности были добавлены позже. Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен был без стилистических и структурных искажений воспроизводиться на оборудовании с различной технической оснащённостью (цветной экран современного компьютера, монохромный экран органайзера, ограниченный по размерам экран мобильного телефона или устройства и программы голосового воспроизведения текстов). Однако современное применение HTML очень далеко от его изначальной задачи. Например, тег <TABLE>, несколько раз использованный для форматирования страницы, которую вы сейчас читаете, предназначен для создания в документах самых обычных таблиц, но, как можно убедиться, здесь нет ни одной таблицы. С течением времени, основная идея платформонезависимости языка HTML была отдана в своеобразную жертву современным потребностям в мультимедийном и графическом оформлении.
Браузеры
Текстовые документы, содержащие код на языке HTML (такие документы традиционно имеют расширение «html» или «htm»), обрабатываются специальными приложениями, которые отображают документ в его форматированном виде. Такие приложения, называемые браузерами или интернет-обозревателями, обычно предоставляют пользователю удобный интерфейс для запроса веб-страниц, их просмотра (и вывода на иные внешние устройства) и, при необходимости, отправки введённых пользователем данных на сервер. Наиболее популярными на сегодняшний день браузерами являются Internet Explorer, Firefox, Safari, Google Chrome и Opera.
· RFC 1866 — HTML 2.0, одобренный как стандарт 22 сентября 1995;
· HTML 3.2 — 14 января 1997;
· HTML 4.0 — 18 декабря 1997;
· HTML 4.01 (изменения, причём более значительные, чем кажется на первый взгляд) — 24 декабря 1999;
· ISO/IEC 15445:2000 (так называемый ISO HTML, основан на HTML 4.01 Strict) — 15 мая 2000.
· HTML 5 — в разработке.
Официальной спецификации HTML 1.0 не существует. До 1995 года существовало множество неофициальных стандартов HTML. Чтобы стандартная версия отличалась от них, ей сразу присвоили второй номер.
Версия 3 была предложена Консорциумом Всемирной паутины (W3C) в марте 1995 года и обеспечивала много новых возможностей, таких как создание таблиц, «обтекание» изображений текстом и отображение сложных математических формул. Даже при том, что этот стандарт был совместим со второй версией, реализация его была сложна для браузеров того времени. Версия 3.1 официально никогда не предлагалась, и следующей версией стандарта HTML стала 3.2, в которой были опущены многие нововведения версии 3.0, но добавлены нестандартные элементы, поддерживаемые браузерами «Netscape» и «Mosaic».
HTML версии 4.0 содержит много элементов, специфичных для отдельных браузеров[источник не указан 17 дней], но в то же время произошла некоторая «очистка» стандарта. Многие элементы были отмечены как устаревшие и нерекомендованные (англ. deprecated). В частности, элемент font, используемый для изменения свойств шрифта, был помечен как устаревший (вместо него рекомендуется использовать таблицы стилей CSS).
Начиная с 2004 года, сообществом WHATWG, ведётся разработка HTML версии 5.
Перспективы
Сейчас Консорциум Всемирной паутины (W3C) разрабатывает HTML версии 5. Черновой вариант спецификации языка появился в Интернете 20 ноября 2007. Параллельно ведётся работа по дальнейшему развитию HTML под названием XHTML (от англ. Extensible Hypertext Markup Language — «расширяемый язык разметки гипертекста»). Пока XHTML по своим возможностям сопоставим с HTML, однако предъявляет более строгие требования к синтаксису. Как и HTML, XHTML является подмножеством языка SGML, однако XHTML, в отличие от предшественника, основан на XML. Вариант XHTML 1.0 был одобрен в качестве Рекомендации Консорциума Всемирной паутины (W3C) 26 января 2000 года.!
Планируемая спецификация XHTML 2.0 разрывает совместимость со старыми версиями HTML и XHTML, что не очень устраивает некоторых веб-разработчиков и производителей браузеров. Группой WHATWG (англ. Web Hypertext Application Technology Working Group) разрабатывается спецификация Web Applications 1.0, часто неофициально называемая «HTML 5», которая расширяет HTML (впрочем, имея и совместимый с XHTML 1.0 XML-синтаксис) для лучшего представления семантики различных типичных страниц, например форумов, сайтов аукционов, поисковых систем, онлайн-магазинов и т. д., которые не очень удачно вписываются в модель XHTML 2.
Структура HTML-документа
HTML — это теговый язык разметки документов. Любой документ на языке HTML представляет собой набор элементов, причём начало и конец каждого элемента обозначается специальными пометками — тегами. Элементы могут быть пустыми, то есть не содержащими никакого текста и других данных (например, тег перевода строки <br>). В этом случае обычно не указывается закрывающий тег. Кроме того, элементы могут иметь атрибуты, определяющие какие-либо их свойства (например, размер шрифта для элемента font). Атрибуты указываются в открывающем теге. Вот примеры фрагментов HTML-документа:
· <strong>Текст между двумя тегами — открывающим и закрывающим.</strong>
· <a href="http://www.example.com">Здесь элемент содержит атрибут href.</a>
· А вот пример пустого элемента: <br>
Регистр, в котором набрано имя элемента и имена атрибутов, в HTML значения не имеет (в отличие от XHTML). Элементы могут быть вложенными. Например, следующий код:
<b>Этот текст будет жирным,<i>а этот - ещё и курсивным</i></b>даст такой результат:
Этот текст будет жирным, а этот - ещё и курсивным
Кроме элементов, в HTML-документах есть и сущности (англ. entities) — «специальные символы». Сущности начинаются с символа амперсанда и имеют вид &имя; или &#NNNN;, где NNNN — код символа в Юникоде в десятеричной системе счисления.
Например, © — знак авторского права (©). Как правило, сущности используются для представления символов, отсутствующих в кодировке документа, или же для представления «специальных» символов: & — амперсанда (&), < — символа «меньше» (<) и > — символа «больше» (>), которые некорректно записывать «обычным» образом, из-за их особого значения в HTML.
Список основных тегов и специальных символов приведён в статье Элементы HTML. Более обширный список специальных символов приведён в статье Википедия:Специальные символы.
Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии, должен начинаться со строки объявления версии HTML <!DOCTYPE…>, которая обычно выглядит примерно так:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
Если эта строка не указана, то добиться корректного отображения документа в браузере становится труднее.
Далее обозначается начало и конец документа тегами <html> и </html> соответственно. Внутри этих тегов должны находиться теги заголовка (<head></head>) и тела (<body></body>) документа.
Использованная литература
1) http://ru.wikipedia.org/
2) Филдинг, Р.; Геттис, Дж.; Могул, Дж.; Фристик, Г.; Мазинтер, Л.; Лич, П.; Бернерс-Ли, Т. (Июнь 1999). "Hypertext Transfer Protocol — http://1.1". Request For Comments 2616. Information Sciences Institute.
3) Бернерс-Ли, Тим; Брэй, Тим; Конноли, Дэн; Коттон, Пол; Филдинг, Рой; Джекл, Марио; Лилли, Крис; Мендельсон, Ной; Оркард, Дэвид; Уолш, Норман; Уиллиамс, Стюарт (Декабрь 15, 2004). "Architecture of the World Wide Web, Volume One". Version 20041215. W3C.
4) Поло, Лучано World Wide Web Technology Architecture: A Conceptual Analysis. New Devices (2003). Проверено Июль 31 2005.