13 июл. 2010 г.

Обзор языка Java

Java

Java — объектно-ориентированный язык программирования, разрабатываемый компанией Sun Microsystems с 1991 года и официально выпущенный 23 мая 1995 года. Многие люди, говоря на русском, называют язык «Ява» по аналогии с географическим названием. 

Java — так называют не только сам язык, но и платформу для создания приложений уровня предприятий на основе данного языка. 


Изначально новый язык программирования назывался Oak (James Gosling) и разрабатывался для бытовой электроники, но впоследствии был переименован в Java и стал использоваться для написания приложений и серверного программного обеспечения. 


Программы на Java могут быть транслированы в байт-код, выполняемый на виртуальной java-машине (JVM) — программе, обрабатывающей байтовый код и передающей инструкции оборудованию, как интерпретатор, но с тем отличием, что байтовый код в отличие от текста обрабатывается значительно быстрее. 


Достоинство подобного способа выполнения программ — в полной независимости байт-кода от ОС и оборудования, что позволяет выполнять Java приложения на любом устройстве, которое поддерживает виртуальную машину. Другой важной особенностью технологии Java является гибкая система безопасности, благодаря тому, что исполнение программы полностью контролируется виртуальной машиной. Любые операции, которые превышают установленные полномочия программы (например, попытка несанкционированного доступа к данным или соединения с другим компьютером) вызывают немедленное прерывание. Это позволяет пользователям загружать программы, написанные на Java, на их компьютеры (или другие устройства, например, мобильные телефоны) из неизвестных источников, при этом не опасаясь заражения вирусами, пропажи ценной информации, и т. п.


Часто к недостаткам этого подхода относят то, что исполнение байт-кода виртуальной машиной может снижать производительность программ и алгоритмов, реализованных на языке Java. Данное утверждение справедливо для первых версий виртуальной машины Java, однако в последнее время оно практически потеряло актуальность. Этому способствовал ряд усовершенствований: применение технологии JIT (Just-In-Time compilation), позволяющей переводить байт-код в машинный код во время исполнения программы с возможностью сохранения версий класса в машинном коде, широкое использование native-кода в стандартных библиотеках, а также аппаратные средства, обеспечивающие ускоренную обработку байт-кода (например, технология Jazelle, поддерживаемая некоторыми процессорами фирмы ARM).
Внутри Java существуют три основных семейства технологий:
J2EE или Java EE (начиная с v1.5) — Java Enterprise Editon, для создания программного обеспечения уровня предприятия;
J2SE или Java SE (начиная с v1.5) — Java Standard Editon, для создания пользовательских приложений, в первую очередь — для настольных систем;
J2ME, Java ME или Java Micro Edition, для использования в устройствах, ограниченных по вычислительной мощности, в том числе мобильных телефонах, PDA, встроенных системах
Самыми популярными считаются серверные технологии семейства J2EE. Здесь Java действительно держит мировое лидерство. 


Последним релизом является версия 1.6, в которой было произведено улучшение системы безопасности, улучшение поддержки XML и скриптового языка Mozilla Rhino, улучшена интеграция с рабочим столом, добавлены некоторые новые возможности в создании графических интерфейсов. 


Прежняя версия JVM от Microsoft (аналог SUN JVM v.1.1.3) во многом отступает от стандартов языка, предложенных Sun Microsystems, с целью проприетарной поддержки платформы Windows. Впоследствии это явилось поводом для судебных исков со стороны Sun Microsystems к Microsoft. Суд принял сторону компании Sun Microsystems. В настоящее время между двумя компаниями достигнуты договорённости вплоть до снятия взаимных судебных претензий и произведено взаимное кросс-лицензирование технологий. По версии Microsoft будет поддерживаться спецификация MS-J# соответствующая спецификации SUN-JVM J2SE.


Следующие успешные проекты реализованы с привлечением Java (J2EE) технологий: Amazon, eBay, Flickr, Google (Gmail), Yandex, LinkedIn. 


Следующие компании в основном фокусируются на Java (J2EE) технологиях, а не на .NET, хотя имеют дело также и с последними: SAP, IBM, Oracle. 

Основные возможности

расширенные возможности обработки исключительных ситуаций;
богатый набор средств фильтрации ввода/вывода;
набор стандартных коллекций, таких как массив, список, стек и т. п.;
наличие простых средств создания сетевых приложений (в том числе с использованием протокола RMI);
наличие классов, позволяющих выполнять HTTP-запросы и обрабатывать ответы;
встроенные в язык средства создания многопоточных приложений;
унифицированный доступ к базам данных на основе JDBC и SQLJ.
поддержка шаблонов (начиная с версии 1.5) 

Пример программы

Программа, выводящая «Hello, World!»:

public class HelloWorld {
    public static void main(String[] args) {
        System.out.println("Hello, World!");
    }
}
Пример использования шаблонов:

public class Sample {
    public static void main(String[] args) {
        // Создание объекта по шаблону.
        List strings = new LinkedList();
        strings.add("Hello");
        strings.add("world");
        strings.add("!");
        for (String s : strings) {
            System.out.print(s);
            System.out.print(" ");
        }
    }
}

Основные идеи

Предопределённые типы

В языке Java только 8 предопределённых (т. е. заданных в самом языке, а не в какой-то из стандартных библиотек) типов: boolean, byte, char, short, int, long, float, double. В отличие от C++, в Java нет ни беззнаковых типов, ни типов вроде long double, наличие или отсутствие которых определяется реализацией.
Длины и диапазоны значений предопределённых типов определяются стандартом, а не реализацией и приведены в таблице. Тип char сделали двухбайтовым для удобства локализации (один из идеологических принципов Java): когда складывался стандарт, уже существовал Unicode-16, но не Unicode-32. Поскольку в результате не осталось однобайтового типа, добавили новый тип byte. Типы float и double могут иметь специальные значения , и «не число». Для типа double они обозначаются Double.POSITIVE_INFINITY, Double.NEGATIVE_INFINITY, Double.NaN; для типа float — так же, но с приставкой Float вместо Double. Минимальные положительные значения, принимаемые типами float и double, тоже стандартизованы. 

Тип Длина (в байтах) Диапазон или набор значений

ТипДлина (в байтах)Диапазон или набор значений
booleanне определеноtrue, false
byte1?128..127
char20..216, или 0..65536
short2?215..215-1, или ?32768..32767
int4?231..231-1, или ?2147483648..2147483647
long8?263..263-1, или примерно ?9.2·1018..9.2·1018
float4-(2-2-23)·2127..(2-2-23)·2127, или примерно ?3.4·1038..3.4·1038, NaN
double8-(2-2-52)·21023..(2-2-52)·21023, или примерно ?1.8·10308..1.8·10308, NaN


Такая жёсткая стандартизация была необходима, чтобы сделать язык платформенно-независимым, что является одним из идеологических требований к Java и одной из причин её успеха. Тем не менее одна небольшая проблема с платформенной независимостью всё же осталась. Некоторые процессоры используют для промежуточного хранения результатов 10-байтовые регистры или другими способами улучшают точность вычислений. Для того, чтобы сделать Java максимально совместимой между разными системами, в ранних версиях любые способы повышения точности вычислений были запрещены. Однако это приводило к снижению быстродействия. Выяснилось, что ухудшение точности ради платформенной независимости мало кому нужно, тем более если за это приходится платить замедлением работы программ. После многочисленных протестов этот запрет отменили, но добавили ключевое слово strictfp, запрещающее повышение точности. 

Преобразования предопределённых типов при математических операциях

В языке Java действуют следующие правила:

Если один операнд имеет тип double, другой тоже преобразуется к типу double.
Иначе, если один операнд имеет тип float, другой тоже преобразуется к типу float.
Иначе, если один операнд имеет тип long, другой тоже преобразуется к типу long.
Иначе оба операнда преобразуется к типу int.
Последнее правило отличает Java от C и C++ и делает код более безопасным. Так, например, в языке Java после выполнения кода
short x=50, y=1000; int z=x*y;

z присваивается значение 50000, а не ?15536, как в большинстве реализаций C и C++. 

Указатели

В языке Java значение любого типа, кроме предопределённого, является указателем (принцип «всё есть указатели»). Это подчёркивается синтаксисом описания переменных. Так, в Java нельзя писать
double a[10][20];
Foo b(30);
,а нужно
double[][] a = new double[10][20];
Foo b = new Foo(30);
В отличие от C и C++, указатели в Java в высокой степени безопасны благодаря жёстким ограничениям на их использование, в частности:

Нельзя преобразовывать объект типа int или любого другого предопределённого типа в указатель и наоборот.
Над указателями запрещено выполнять операции ++, --, +, — или любые другие арифметические операции.
Преобразование типов между указателями жёстко регламентировано. За исключением указателей на массивы, разрешено преобразовывать указатели только между наследуемым типом и его наследником, причём преобразование наследуемого типа в наследующий должно быть явно задано и во время выполнения производится проверка его осмысленности. Преобразования указателей на массивы разрешены лишь тогда, когда разрешены преобразования их базовых типов, а также нет конфликтов размерности.
В Java нет операций взятия адреса (&) или взятия объекта по адресу (*). Звёздочка в Java означает умножение, и только. Амперсанд (&) означает всего лишь «побитовое и» (двойной амперсанд — «логическое и»).
Своей безопасностью и некоторыми ограничениями указатели в Java напоминают ссылки в C++ и указатели в языке Паскаль. Благодаря ограничениям, в Java невозможно прямо обратиться к памяти по заданному адресу; невозможно и создать указатель, указывающий на значение другого типа или на мусор (хотя указатели, не указывающие ни на что, есть: такой указатель обозначается null).

Клонирование

При присваивании может возникнуть проблема. Так, если написать
Foo foo, bar;
…

bar=foo
то foo и bar будут указывать на одну и ту же область памяти; попытка изменить foo будет менять и bar, и наоборот. Для решения этой проблемы пользуются или методом (функцией-членом, в терминологии C++) clone, создающим копию объекта, или же копирующим конструктором.
Метод clone требует, чтобы класс реализовывал интерфейс Cloneable (об интерфейсах см. ниже). Если класс реализует интерфейс Cloneable, по умолчанию clone копирует все поля (мелкая копия). Если требуется не копировать, а клонировать поля (а также их поля и так далее), надо переопределять метод clone. Определение и использование метода clone часто является нетривиальной задачей. 

Сборка мусора

В языке Java реализована сборка мусора. Хотя не существует операции явного удаления объекта из памяти, традиционным приёмом, дающим сборщику мусора «намёк» на освобождение памяти, является присваивание переменной пустого значения null. Существует также метод для инициации принудительной сборки мусора, но его не рекомендуется использовать для обычной работы. 

Классы и функции

Java не является процедурным языком: любая функция может существовать только внутри класса. Это подчёркивает терминология языка Java, где нет понятий «функция» или «функция-член» (member function), а только метод. В методы превратились и стандартные функции. Например, в Java нет функции sin, а есть метод Math.sin класса Math (содержащего, кроме sin, методы cos, exp, sqrt, abs и многие другие). 

Статические методы и поля

Для того чтобы не надо было создавать объект класса Math (и других аналогичных классов) каждый раз, когда надо вызвать sin (и другие подобные функции), введено понятие статических методов (static method; иногда в русском языке они называются статичными). Статический метод (отмечаемый словом static в описании) можно вызвать, не создавая объекта его класса. Поэтому можно писать
double x = Math.sin(1);
вместо

Math m = new Math(); double x = m.sin(1);
Ограничение, накладываемое на статические методы, заключается в том, что в объекте this они могут обращаться только к статическим полям и методам. Статические поля имеют тот же смысл, что и в C++: каждое существует только в одном экземпляре. 

Финальность

Слово final (финальный) означает разные вещи при описании переменной, метода или класса. Финальная переменная инициализируется при описании и дальше не может быть изменена. Финальный метод не может быть переопределён при наследовании. Финальный класс не может иметь наследников вообще. 

Абстрактность

В Java все методы являются виртуальными в терминологии C++: при вызове метода, по-разному определённого в базовом и наследующем классах, всегда производится проверка времени выполнения. Абстрактным методом (описатель abstract) в Java называется метод, для которого заданы параметры и тип возвращаемого значения, но не тело. Абстрактный метод определяется в классах-наследниках. В C++ то же самое называется чисто виртуальной функцией. Для того чтобы в классе можно было описывать абстрактные методы, сам класс тоже должен быть описан как абстрактный. Объекты абстрактного класса создавать нельзя. 

Интерфейсы

Высшей степенью абстрактности в Java является интерфейс (interface). Все методы интерфейса абстрактны: описатель abstract даже не требуется. Интерфейс не является классом. Класс может наследовать, или расширять (extends), другой класс или реализовывать (implements) интерфейс. Кроме того, интерфейс может наследовать, или расширять, другой интерфейс.
В Java класс не может наследовать более одного класса, зато может реализовывать сколько угодно интерфейсов.
Интерфейсы можно передавать методам как параметры, но нельзя создавать объекты их типов.

Проверка принадлежности к классу

В Java можно явно проверить, к какому классу принадлежит объект. Выражение foo instanceof Foo истинно, если объект foo принадлежит классу Foo или его наследнику, или реализует интерфейс Foo (или, в общем виде, наследует класс, который реализует интерфейс, который наследует Foo).
Далее, функция getClass(), определённая для всех объектов, выдаёт объект типа Class. Эти объекты можно сравнивать.
Так, например, foo.getClass()==bar.getClass() будет истинно, если foo и bar принадлежат в точности к одному классу. 

Библиотеки классов

CDK — для создания химического ПО
MARF — модульная библиотека для распознавания аудио