由于java编程语言和C、C++的数据类型不一致,所以在JNI和native代码直接数据类型的映射就成了问题。这里将学习java编程语言和native代码之间的类型如何转换。
一个简单的native方法
我们在java中实现这样一个类,保存为Prompt.java:
class Prompt {
public static void main(String[] args) {
Prompt p = new Prompt();
String input = p.getLine("Type a line: ");
System.out.println("User typed: " + input);
}
static {
System.loadLibrary("Prompt");
}
/* native method that prints a prompt and reads a line */
public native String getLine(String prompt);
}
回顾一下上节中讲的使用JNI的步骤:
首先用javac Prompt.java生成Prompt.class,然后用javah -jni Prompt自动生成Prompt.h。在头文件Prompt.h中我们将看到:
/* DO NOT EDIT THIS FILE - it is machine generated */
#include <jni.h>
/* Header for class Prompt */
#ifndef _Included_Prompt
#define _Included_Prompt
#ifdef __cplusplus
extern "C" {
#endif
/*
* Class: Prompt
* Method: getLine
* Signature: (Ljava/lang/String;)Ljava/lang/String;
*/
JNIEXPORT jstring JNICALL Java_Prompt_getLine
(JNIEnv *, jobject, jstring);
#ifdef __cplusplus
}
#endif
#endif
它们保证了该方法从native库中被导出,并且以正确的调用方式生成该函数(其实主要是指参数入栈方式)。
不知大家注意到了signature没有,
(Ljava/lang/String;)Ljava/lang/String;它指示了native方法的参数和返回值类型:(Ljava/lang/String;)表示该方法在java语言中的的参数是String。括号后的Ljava/lang/String表示该方法在java语言中的返回值是String
根据我们在上一节中讲的,几遍没有java代码,我们也可以从这个头文件中看出:这个native方法在java中的定义:
class Prompt {
xxx native String getLine(String);
}
native方法的参数
如上所述,可以发现每个native方法在从java转成C、C++格式的方法时,会增加额外的两个参数:
1)第一个参数JNIEnv *:它指向一个包含了函数表的指针的地址,每个指针都指向了一个JNI函数。native方法经常通过JNI方法来访问一个在java VM中的数据结构。下图是JNIEnv接口指针:
2)第二个参数,根据native方法是一个static方法还是一个实例方法而不同的。如果是一个实例方法,它就是调用该方法的对象的引用,和C++中的this指针类似(此时类型为jobject)。如果是一个static方法,那它就对应着包含该方法的类(此时类型为jclass)。在本例中,Java_Prompt_getLine方法,是一个实例方法,所以这个参数是对象的自己的引用。
类型映射
在native方法声明(java中的声明)中的参数类型,在native编程语言中有着对应的类型。JNI定义了一组和java编程语言对应的C、C++类型。
大家知道,在java编程语言中有两种类型:基础类型(例如:int, float, char...)以及引用类型(例如:类、实例、数组)。在java编程语言中,字符串是java.lang.String类的实例。
JNI对待基础类型和引用类型是不同的。基础类型的映射是简单、直接的。例如java语言中的int映射到C、C++的jint(定义在jni.h中,是一个有符号的32为整数),而java中的float对应于C++的jfloat(定义在jni.h中,是一个32为浮点型),下表是JNI和java的类型对应:
java语言类型 | native类型 | 描述说明 |
boolean | jboolean | unsigned 8 bits |
byte | jbyte | signed 8 bits |
char | jchar | unsigned 16 bits |
short | jshort | signed 16 bits |
int | jint | signed 32 bits |
long | jlong | signed 64 bits |
float | jfloat | 32bits |
double | jdouble | 64 bits |
此外还有一个jsize整型,被用来描述主要的索引和大小typedef jint jsize。
JNI把对象作为透明的引用传递给native方法。不透明的引用是和java VM中和内部数据结构相关的C的指针类型。而内部数据结构真正的布局,对于开发人员来说是不可见的,被隐藏的。native代码必须通过合适的JNI函数才能操控下面的对象,这些JNI函数可以通过JNIEnv接口指针来访问。例如在JNI中对应于java.lang.String的类型是jstring。而jstring引用的确切的值和native代码是不相干的。native代码调用JNI方法(例如GetStringUTFChars())来访问一个字符串的内容。
所有的JNI引用都有jobject类型。为了便捷和类型安全,JNI定义了一组引用类型,它们从概念上讲,是jobject的子类型。(A是B的一个子类型,那么A的每个实例自然也是B的一个实例)。这些子类型相当于java语言中常用的引用类型。例如(jstring表示字符串,jobjectArray表示一个对象数组)。以下是JNI引用类型和它的子类型关系的完整列表:
在C语言中,所有的其它的引用类型都被定义为同样的对象。例如
typedef jobject jclass;
在C++中,JNI引入一组虚类,来表达各个引用类型之间的子类型关系:
class _jobject {};
class _jclass : public _jobject {};
class _jthrowable : public _jobject {};
class _jstring : public _jobject {};
class _jarray : public _jobject {};
class _jbooleanArray : public _jarray {};
class _jbyteArray : public _jarray {};
class _jcharArray : public _jarray {};
class _jshortArray : public _jarray {};
class _jintArray : public _jarray {};
class _jlongArray : public _jarray {};
class _jfloatArray : public _jarray {};
class _jdoubleArray : public _jarray {};
class _jobjectArray : public _jarray {};
typedef _jobject *jobject;
typedef _jclass *jclass;
typedef _jthrowable *jthrowable;
typedef _jstring *jstring;
typedef _jarray *jarray;
typedef _jbooleanArray *jbooleanArray;
typedef _jbyteArray *jbyteArray;
typedef _jcharArray *jcharArray;
typedef _jshortArray *jshortArray;
typedef _jintArray *jintArray;
typedef _jlongArray *jlongArray;
typedef _jfloatArray *jfloatArray;
typedef _jdoubleArray *jdoubleArray;
typedef _jobjectArray *jobjectArray;
访问字符串
如上所说的,对于引用类型,native代码并不能直接访问,jstring表示java VM中字符串,并且和普通的C字符串是不一样的,在native代码中不能像使用普通C字符串一样使用它们。如下代码,不但达不到预期的效果,而且还有可能导致java VM当机。
JNIEXPORT jstring JNICALL Java_Prompt_getLine(JNIEnv *penv, jobject obj, jstring strPrompt)
{
/*error: incorrect use of jstring as a char* pointer */
printf("%s", strPrompt);
...
}
转换到native字符串
由于上诉原因,在native方法的代码中,必须使用一个合适的JNI接口函数将jstring对象转换C、C++字符串。JNI支持从Unicode和向Unicode转换,同时也支持从UTF-8和向UTF-8转换。Unicode字符串用16bit值表示一个字符,而UTF-8用一个编码方案,它向上兼容7-bit的ASCII字符串。UTF-8像一个NULL结尾的C字符串,即便它们包含了非ASCII字符。所有7-bit的ASCII字符的值在1~127之间,而在UTF-8中也是这些值。一个字节的最高位被设置了,标志了多字节编码的16-bit Unicode值的开始。
Java_Prompt_getLine函数调用JNI函数GetStringUTFChars()来读取字符串的内容。它将jstring 引用(在java VM 中,一般是Unicode序列)转换为C字符串(一般以UTF-8格式代表)。如果能够确定原始字符串只包含7-bit的ASCII字符,你可以将转换后的字符串传给普通的C库的函数,例如printf。(在后面的章节,我们将介绍如何处理非ASCII字符串)。下面是Java_Prompt_getLine的实现(C++):
JNIEXPORT jstring JNICALL Java_Prompt_getLine(JNIEnv *penv, jobject obj, jstring strPrompt)
{
char buf[128];
const jbyte *str;
str = penv->GetStringUTFChars(prompt, NULL);
if (str == NULL) {
return NULL; /* OutOfMemoryError already thrown */
}
printf("%s", str);
penv->ReleaseStringUTFChars(prompt, str);
/* We assume here that the user does not type more than
* 127 characters */
scanf("%s", buf);
return penv->NewStringUTF(buf);
}
GetStringUTFChars()函数的返回值是指针,需要被检查。这是因为为保存UTF-8字符串,java VM需要分配内存资源,这样就有可能分配失败。当失败时GetStringUTFChars()返回NULL,并且抛出一个OutOfMemoryError异常。(在后面的章节中,我们会提到,JNI的异常抛出和java语言中的异常抛出是不一样的)。通过JNI抛出的关起异常,不会自动改变native C代码的控制流程。而是,我们需要一个显示的return语句,来避免该函数中程序继续运行。在Java_Prompt_getLine返回之后,这个异常会被抛送到Prompt.main——native方法:Prompt.getLine的调用者。
释放native字符串资源
当你的native代码完成了使用通过GetStringUTFChars()获得的UTF-8字符串,它调用ReleaseStringUTFChars()。调用ReleaseStringUTFChars(),意味着native方法不再使用该UTF-8字符串,这样被该UTF-8字符串占用的内存就可以被释放了。调用ReleaseStringUTFChars()失败,会导致一个内存泄露,并最重导致内存衰竭。
构造新的字符串
可以在native方法里,通过调用JNI函数:NewStringUTF,构造一个新的java.lang.String实例。这个函数利用一个UTF-8格式的C字符串来构造一个java.lang.String实例。新构造的java.lang.String实例,它是一个Unicode字符串序列,该序列和给定的UTF-8格式的C字符串一致。
如果java VM不能够为新的java.lang.String实例分配内存,NewStrigUTF抛出OutOfMemoryError异常,并且返回NULL,并且该异常会被抛送到Prompt.main方法中(native方法的调用者)。
其他JNI字符串函数
JNI在GetStringUTFChars、ReleaseStringUTFChars、NewStringUTF函数之外,还支持许多其他字符串相关的函数。
GetStringChars、ReleaseStringChars获取Unicode格式的字符串,当系统支持Unicode的时候,这个些函数非常有用。
UTF-8字符串,通常以‘\0’字符结尾,而Unicode字符串却不是。为了获得一个jstring引用中的Unicode字符的个数,JNI开发人员可以调用JNI函数GetStringLength。为了得知需要多少字节来保持一个UTF-8格式的jstring,开发人员可以在GetStringUTFChars的返回中调用strlen, 或者直接调用JNI函数GetStringUTFLength。
注意:
不管如何,当不再继续使用通过GetStringChars、GetStringUTFChars获取到的字符串时,需要调用ReleaseStringChars、ReleaseStringUTFChars来释放分配的内存资源。
Java2 JDK1.2中新的JNI字符串函数
为了增加java VM返回直接指向java.lang.String实例中的字符的指针的可能性,java2 JDK1.2引入了一对新的函数:GetStringCritical、ReleaseStringCritical。表面上它和GetStringChars、ReleaseStringChars相似(如果可能,它们都返回指向字符的指针,否则都是一个副本),然而,如何使用这对函数有很大的限制。
必须把在这对函数之间的代码当中临界区。在一个临界区中,native代码必须不能任意的调用JNI函数,或者或者不能调用任何一个可能会导致当前线程被阻塞,并且等待在java VM中的其它线程运行的native函数。例如,当前线程必须不能等待一个输入的I/O流(该流由其它线程写入)。
这些严格的限制使VM在native代码持有一个通过GetStringCritica函数获取到的直接执行字符串元素的指针时停止垃圾回收。当垃圾回收不被允许时,任何其它触发垃圾回收的线程都会被阻塞。所以在GetStringCritical和ReleaseStringCritical之间的native代码,必须不能引起阻塞调用,或者在java VM中分配一个新的对象,否则,VM可能会死锁。
当GetStringCritical和ReleaseStringCritical重复成对出现,是安全的,以下代码:
jchar *s1, *s2;在GetStringCritical和ReleaseStringcritical之间不允许其它JNI函数调用,唯一可以在其中调用的JNI函数是它们自己。
s1 = (*env)->GetStringCritical(env, jstr1);
if (s1 == NULL) {
... /* error handling */
}
s2 = (*env)->GetStringCritical(env, jstr2);
if (s2 == NULL) {
(*env)->ReleaseStringCritical(env, jstr1, s1);
... /* error handling */
}
... /* use s1 and s2 */
(*env)->ReleaseStringCritical(env, jstr1, s1);
(*env)->ReleaseStringCritical(env, jstr2, s2);
另外增加的JNI函数是:GetStringRegion和GetStringUTFRegion,它们将字符串元素复制到一个预先分配好了的缓冲中。所以,Prompt.getLine方法也可以这样实现:
JNIEXPORT jstring JNICALL
Java_Prompt_getLine(JNIEnv *env, jobject obj, jstring prompt)
{
/* assume the prompt string and user input has less than 128
characters */
char outbuf[128], inbuf[128];
int len = (*env)->GetStringLength(env, prompt);
(*env)->GetStringUTFRegion(env, prompt, 0, len, outbuf);
printf("%s", outbuf);
scanf("%s", inbuf);
return (*env)->NewStringUTF(env, inbuf);
}
GetStringUTFRegion哈市需要一个开始索引和长度,它们都以Unicode字符计。这个方式,在某些程度上比GetStringUTFChars简单,因为GteStringUTFRegion没有内存分配,我们不需要检查out-of-memory条件。
JNI字符串函数的汇总
JNI函数 | 描述 | 起始 |
GetStringChars ReleaseStringChars |
获取或释放一个指向Unicode格式字符串内容的指针。 可能返回该字符串的副本。 |
JDK1.1 |
GetStringUTFChars ReleaseStringUTFChars |
获取或释放一个指向UTF-8格式字符串内容的指针。 可能返回该字符串的副本。 |
JDK1.1 |
GetStringLength | 返回字符串中Unicode字符的格式 | JDK1.1 |
GetStringUTFLength | 返回保持一个UTF-8格式的字符串所需要的字节数 | JDK1.1 |
NewString | 创建一个java.lang.String实例,它包含和给定Unicode C字符串相同的字符序列 | JDK1.1 |
NewStringUTF | 创建一个java.lang.String实例,它包含和给定UTF-8 C字符串相同的字符序列 | JDK1.1 |
GetStringCritical ReleaseStringCritical |
获取一个指向Unicode格式字符串内容的指针。可能返回一个字符串的副本。 native代码在Get/ReleaeStringCritical调用之间必须不能阻塞。 |
Java2 JDK1.2 |
GetStringRegion setStringRegion |
将一个字符串的内容拷贝至或者到一个预先分配好了的C缓冲区中。(以Unicode格式) | Java2 JDK1.2 |
GetStringUTFRegion setStringUTFRegion |
将一个字符串的内容拷贝至或者到一个预先分配好了的C缓冲区中。(以UTF-8格式) | Java2 JDK1.2 |
在JNI字符串函数中选择一个合适的函数
既然有这么多函数可以选择,那么应该选择哪些函数来访问字符串呢?且依照下图所示:
访问数组
JNI对待基础类型数组和对象数组是不同的。例如在java语言中:
int[] iarr;iarr和farr是基础数组,而oarr和arr2确实对象数组。
float[] farr;
Object[] oarr;
int[][] arr2;
在一个native方法中访问基础数组,要求使用那些和访问字符串的函数类似的JNI函数。例如下例:
class IntArray {
private native int sumArray(int[] arr);
public static void main(String[] args) {
IntArray p = new IntArray();
int arr[] = new int[10];
for (int i = 0; i < 10; i++) {
arr[i] = i;
}
int sum = p.sumArray(arr);
System.out.println("sum = " + sum);
}
static {
System.loadLibrary("IntArray");
}
}
在native语言(C、C++)中访问数组
在JNI中,数组被jarrary引用类型以及它的子类型(如jintArray)表示。就如jstring不是一个C的字符串类型一样,jarray同样也不是一个C的数组类型。jarrary在Java_IntArray_sumArray native 方法的实现中,也不能直接访问jarray引用。如下代码,是非法的:
/* This program is illegal! */
JNIEXPORT jint JNICALL
Java_IntArray_sumArray(JNIEnv *env, jobject obj, jintArray arr)
{
int i, sum = 0;
for (i = 0; i < 10; i++) {
sum += arr[i];
}
}
为了正确访问,必须选择一个合适的JNI函数来访问基础数组的元素,例如以下方案:
JNIEXPORT jint JNICALL
Java_IntArray_sumArray(JNIEnv *env, jobject obj, jintArray arr)
{
jint buf[10];
jint i, sum = 0;
(*env)->GetIntArrayRegion(env, arr, 0, 10, buf);
for (i = 0; i < 10; i++) {
sum += buf[i];
}
return sum;
}
访问基础类型的数组
上一例中使用了GetIntArrayRegion函数来访问整型数组,并且把它的所有元素复制到一个C缓冲区中。第三个参数0,是指起始索引,第四个参数10是指需要被复制的元素的个数。只要这些元素被复制到了C缓冲区,就可以在native代码中直接访问它们了。
JNI支持一个对应的函数来运行native代码修改该数组中的元素(setIntArrayRegion)。其它基础类型的数组也同样支持该功能。
JNI支持Get<Type>ArraryElements,Release<Type>ArrayElement家族,它们运行native代码获取一个直接指向基础类型数组元素的指针。由于垃圾回收可能不支持寄存,所有VM可能返指向原数组副本的指针。这样,我们可以重写Java_IntArray_sumArray方法:
JNIEXPORT jint JNICALL
Java_IntArray_sumArray(JNIEnv *env, jobject obj, jintArray arr)
{
jint *carr;
jint i, sum = 0;
carr = (*env)->GetIntArrayElements(env, arr, NULL);
if (carr == NULL) {
return 0; /* exception occurred */
}
for (i=0; i<10; i++) {
sum += carr[i];
}
(*env)->ReleaseIntArrayElements(env, arr, carr, 0);
return sum;
}
GetArrayLength函数返回基础数组或者对象数组中元素的个数。这个固定的长度,是在该数组被第一次分配的时候所决定的。
和字符串的函数一样,java 2 JDK1.2引入了GetPrimitiveArrayCritical和ReleasePrimitiveArrayCritical函数。它们的用户和GetStringCritical、RelaseStringCritical方法一样。
JNI基础数组函数的汇总
JNI函数 | 描述 | 起始 |
Get<Type>ArrayRegion Set<Type>ArrayRegion |
复制基础数组的内容到预先分配 好了的C缓冲区, 或者从C缓冲区复制内容到基础数组。 |
JDK1.1 |
Get<Type>ArrayElements Release<Type>ArrayElements |
获取一个指向基础数组内容的指针, 该指针指向的可能是原数组的一个副本。 |
JDK1.1 |
GetArrayLength | 返回数组元素的个数 | JDK1.1 |
New<Type>Array | 创建一个给定长度的数组 | JDK1.1 |
GetPrimitiveArrayCritical ReleasePrimitiveArratCritical |
获取或者释放一个指向基础数组内容的指针, 该指针可能指向基础数组的一个副本。 |
JDK1.2 |
在各个JNI基础数组函数中选择一个合适的函数
访问对象数组
JNI提供了一对单独的函数来访问对象数组:GetObjectArrayElement返回一个位于给定索引的元素,而SetObjectArrayElement则是更新给定索引上的元素。和基础类型数组不一样的是,你不能一次获取所有的对象元素,或者一次复制多个对象元素。
Strings和数组都是引用类型。你可以使用上述两个函数来访问字符串的数组和数组的数组。如下面例子,创建了一个二维数组,并且打印其中的内容:
class ObjectArrayTest {
private static native int[][] initInt2DArray(int size);
public static void main(String[] args) {
int[][] i2arr = initInt2DArray(3);
for (int i = 0; i < 3; i++) {
for (int j = 0; j < 3; j++) {
System.out.print(" " + i2arr[i][j]);
}
System.out.println();
}
}
static {
System.loadLibrary("ObjectArrayTest");
}
}
静态native方法initIntDArray创建一个给定大小的二维数组,该方法,分配并且初始化该二维数组:
JNIEXPORT jobjectArray JNICALL
Java_ObjectArrayTest_initInt2DArray(JNIEnv *env,
jclass cls,
int size)
{
jobjectArray result;
int i;
jclass intArrCls = (*env)->FindClass(env, "[I");
if (intArrCls == NULL) {
return NULL; /* exception thrown */
}
result = (*env)->NewObjectArray(env, size, intArrCls,
NULL);
if (result == NULL) {
return NULL; /* out of memory error thrown */
}
for (i = 0; i < size; i++) {
jint tmp[256]; /* make sure it is large enough! */
int j;
jintArray iarr = (*env)->NewIntArray(env, size);
if (iarr == NULL) {
return NULL; /* out of memory error thrown */
}
for (j = 0; j < size; j++) {
tmp[j] = i + j;
}
(*env)->SetIntArrayRegion(env, iarr, 0, size, tmp);
(*env)->SetObjectArrayElement(env, result, i, iarr);
(*env)->DeleteLocalRef(env, iarr);
}
return result;
}
其中调用JNI函数:FindClass来获得一个二维int数组的元素的类的引用。“[I”参数是JNI累的描述符,它对应着java语言中的int[ ]类型。FindClass在加载失败时,会返回NULL,并且抛出一个异常。
NewObjectArray分配了一个数组,它的元素的类型由iniArrCls引用表示。到此,NewObjectArray只是分配了第一维,我们需要填满它的第二维。java VM对于多为数组,没有特定的数据结构。一个二维的数组,其实就是一个数组的数组(以此类推)。
创建第二维的代码非常直接、简单。函数分配独立的数组元素,并用SetIntArrayRegion复制tmp[ ]临时缓冲区的内容到新分配的一维数组中。这之后,数组i行j列的的元素的值被设置为i+j。于是将输出:
0 1 2
1 2 3
2 3 4
DeleteLocalRef在循环的最后被调用,这保证了VM不会耗尽内存(用来保持JNI引用,例如iarr)。在以后的章节中会解释它。