听闻“大多数面试都会问到的问题”里有一道关于向函数内传入列表的题目,形如:
def func(some_list):
some_list[0] = 99;
some_list = [33, 44, 55]
return;
li = [1, 2, 3]
func(li)
print(li) # 这里会显示什么?
答案是 “[99, 2, 3]” 。
因为列表类型属于“引用类型”,引用类型传入函数内可以改变其成员的值 (比如列表内的值),但是在函数内改变引用不会影响函数外的那个引用。
不只是 python,将数据分为引用类型和值类型的语言如 Java 和 C# 都会涉及到这样的问题。因为它们对数据的封装或者说修饰的完成度更高,经验不多的人在使用它们的时候可能产生混淆。
如果换一种形式来描述引用类型,一切将会很清晰。
在 C 语言中使用者可以手动地分配指定大小的内存,用指针作为内存块的标签,而向函数传递信息时一定是传递值的 (传入指针的情形,是传入一个代表内存地址的十六进制整数)。
于是前述的问题在 C 语言中表述为:
#include <stdio.h>
#include <stdlib.h>
void Read(const int* list, const int len)
{
int i;
for (i=0; i<len; i++)
{
if (i != 0)
putchar(' ');
printf("%d", list[i]);
}
putchar('\n');
return;
}
// 传入函数的指针只是向函数传递了一个表示内存地址的整数
void Change(int* list)
{
list[0] = 404;
list = (int*)calloc(15, sizeof(int));
int i;
for (i=0; i<15; i++)
list[i] = i<<1;
puts("In function: ");
Read(list, 15);
return;
}
int main(void)
{
int* li = (int*)calloc(5, sizeof(int));
int i;
for (i=0; i<5; i++)
li[i] = i;
puts("Original: ");
Read(li, 5);
Change(li);
puts("Final, out of function: ");
Read(li, 5);
return 0;
}
上述程序的输出是:
Original:
0 1 2 3 4
In function:
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
Final, out of function:
404 1 2 3 4
发生了什么?
首先在 main() 内手动申请了一块内存用于保存一个数组 li,接下来将表示这个数组的指针 li 传入 Change() 中,改变了数组的一个值,之后改变了传入指针的指向了一个新的位置,最后在 Change() 外输出 li。
而如前述,C 语言对函数总是传值的,传入一个指针,也只是告知函数一个代表内存地址的整数,这个在函数内的值 (形参) 并不是原本的值 (实参),只是一个相等的复制体。
而 Java、C#和 python 这样将数据分为值类型和引用类型的语言,引用类型的实现机制类似 C 语言中的指针。它们在语法层面掩蔽了形式上的指针 (C# 中依然能使用指针,但有限制),配合相应的自动回收内存的机制在使用上更便利,也让这些语言的使用者更难从它们本身理解引用类型的行为。