javascript下過濾數組重復值的代碼(類似于SQL的distinct)
|
admin
2012年4月23日 21:51
本文熱度 12670
|
<script language="javascript"> function getNoRepeat() { return arguments[0].join('‖').match(/(\b[^‖]+\b)(?!.*‖\1\b)/ig); } var tmpArr = [1, 'a', 'ab', 'abc', 'd', 1.2, 'a+b', 'd', 'e', 5, 'a', 1, 'h', 'c', 'ab']; var retArr = getNoRepeat(tmpArr); alert(retArr); </script>
<script> alert("1,11,1.11,1111,111,11,1,1.11".match(/(\b\d+(?:\.\d+)?\b)(?!.*,\1\b)/g)) </script>
<script> alert("123450,0,1,2,5,3,2,12,4,1,1,123450".match(/(\b\d+\b)(?!.*,\1(,|$))/ig)) </script>
<script> alert("123450,0,1,2,5,3,2,12,4,1,1,123450".match(/(\b\d+\b)(?!(?:,[^,]+)*,\1(?:,|$))/ig)) </script>
<script> var s = "0,1,2,5,3,2,12,4,1,1,123450"; var sTmp = (","+s.split(",").reverse().join(",")+",").replace(/,([^,]+)(?=,.*,\1,)/ig, '').split(",").reverse().join(); sTmp = sTmp.substr(1, sTmp.length-2); alert(sTmp) </script>
<script> var strArr = "123450,0,1,2,5,3,2,12,4,1,1,123450".split(",") var str = "," for(i = 0; i < strArr.length; i++) { if(str.indexOf("," + strArr[i] + ",") == -1)str += strArr[i] + "," } alert(str.substring(1,str.length - 1)) </script>
該文章在 2012/4/23 21:51:03 編輯過
| |
全部評論5 |
|
admin
2012年4月23日 21:55
js數組中去除重復值
<script>
Array.prototype.del = function() {
var a = {}, c = [], l = this.length;
for (var i = 0; i < l; i++) {
var b = this[i];
var d = (typeof b) + b;
if (a[d] === undefined) {
c.push(b);
a[d] = 1;
}
}
return c;
}
alert([1, 1, 2, 3, 4, 5, 4, 3, 4, 4, 5, 5, 6, 7].del());
</script>
[Ctrl+A 全選 注:如需引入外部Js需刷新才能執行]
方法二
復制代碼 代碼如下:
//去重復數組
function unique(data){
data = data ││ [];
var a = {};
len = data.length;
for (var i=0; i<len;i++){
var v = data[i];
if (typeof(a[v]) == 'undefined'){
a[v] = 1;
}
};
data.length=0;
for (var i in a){
data[data.length] = i;
}
return data;
}
方法三
復制代碼 代碼如下:
var arr = ["123","123","123","123","sfsdf","123","345","123","123","345","456","567","sdc"];
var str = [];
for(var i = 0,len = arr.length;i < len;i++){
! RegExp(arr[i],"g").test(str.join(",")) && (str.push(arr[i]));
}
alert(str);
方法四
復制代碼 代碼如下:
var pureMulti1=function(arr){
var obj={};
var a = [];
for(var i=0,l=arr.length;iif(!((arr[i]+"") in obj)){
a.push(arr[i]);
}
obj[arr[i]]="";
}
return a;
} 該評論在 2012/4/23 21:56:04 編輯過
|
|
admin
2012年4月23日 21:56
百度面試時問的一道題目,蠻常規的,但是當時自己的回答挺差勁的。現在總結記錄下~
代碼如下:
題目:要求寫一個函數,去掉給定數組中的重復值。
如:
傳入數組 a = [0, 8, 5, 4, 78, 8, 90, 4, 'a', 'b', 'a'];
要求返回:[0,4,5,8,78,90,a,b]
對于這個題目,在面試之后也想了好多次,不過一直沒能想出一個時間復雜度較低的方法。昨天下午在宿舍看《JavaScript語言精粹》看到一個書中的一段代碼有所觸發,于是在jsfiddle上測試了,成功。代碼如下(完整版參見jsfiddle)
var getNR = function(src) {
src = src ││ [];
var res = {};
var curr = [];
var i, j = 0,temp, name;
for (i = 0; i < src.length; i++) {
temp = src[i];
if (res[temp]) {
//do noting
} else {
res[temp] = 1;
}
}
for (name in res) {
if (res.hasOwnProperty(name)) {
curr[j++] = name;
}
}
return curr;
};
總結一下我的思路:
思路一:將目標數組進行排序,然后依序刪除重復的數組,但這樣在刪除重復元素的同時也改變數組原有元素的屬性,明顯是不符合要求的,del。
思路二:新建一個數組b,將a中的元素push到b中,但是在push之前檢查該元素是否存在。這個時間復雜度是n*n,最簡單也是最笨的辦法。
思路三:跟思路二類似,不過充分利用了js對象的屬性,新建一個空對象,將a中的元素作為屬性添加到該對象中,在添加之前檢測該屬性是否已存在。全部添加完后將該對象的屬性依序放到數組中,return
美團面試的題目中有一道這個題目的變種:
要求在Array類上添加一個方法,對于任意數組調用該方法后,去除該數組中的重復元素。
這個變種題考查的知識點多了些,還包括原型,this的理解等。 該評論在 2012/4/23 21:57:39 編輯過
|
|
admin
2012年4月23日 22:22
三個精彩的函數~~大家收到自己的函數庫里去吧~
前兩天做一個功能的時候,為Array擴展了三個方法,可以清除數組中的重復的值。這些值可以是字符串,或者對象~~或者其它。
在網上找了找其它的類同的函數~效率和實現方法都比較差~哈哈~
---------------
// 數據元素唯一化, 較慢但保持元素順序
// 例: [1,2,3,2,1,8,1,6,2]
// 輸出: [1,2,3,8,6]
Array.prototype.unique = function() {
for (var j, i=0, k=this.length; i<k; i++) {
for (j=i+1; j<k; j++) {
if (this[i]===this[j] && k--) this.splice(j, 1);
}
}
}
// 數據元素唯一化, 較快但不能保持元素順序
// 例: [1,2,3,2,1,8,1,6,2]
// 輸出: [1,2,3,8,6]
Array.prototype.q_unique = function() {
for (var j, i=0, k=this.length; i<k; i++) {
for (j=i+1; j<k; j++) {
if (this[i]===this[j]) this[i]=this[--k];
}
}
this.length = k;
}
// 數據元素唯一化, 僅用于排序過的數組(并保持排序狀態)
// 例: [1,2,2,4,4,5,5]
// 輸出: [1,2,4,5]
Array.prototype.s_unique = function() {
for (var j, m, i=0, k=this.length; i<k; i++, k-=m) {
for (j=i+1, m=0; j<k; j++, m++) {
if (this[i]!==this[j]) break;
}
this.splice(i, m);
}
} 該評論在 2012/4/23 22:23:57 編輯過
|
|
admin
2012年4月23日 22:24
- <script>
- //Aiming 的算法
- //---------------
- // 數據元素唯一化, 較慢但保持元素順序
- // 例: [1,2,3,2,1,8,1,6,2]
- // 輸出: [1,2,3,8,6]
- Array.prototype.unique = function() {
- for (var j, i=0, k=this.length; i<k; i++) {
- for (j=i+1; j<k; j++) {
- if (this[i]===this[j] && k--) this.splice(j, 1);
- }
- }
- }
- // 數據元素唯一化, 較快但不能保持元素順序
- // 例: [1,2,3,2,1,8,1,6,2]
- // 輸出: [1,2,3,8,6]
- Array.prototype.q_unique = function() {
- for (var j, i=0, k=this.length; i<k; i++) {
- for (j=i+1; j<k; j++) {
- if (this[i]===this[j]) this[i]=this[--k];
- }
- }
- this.length = k;
- }
- // 數據元素唯一化, 僅用于排序過的數組(并保持排序狀態)
- // 例: [1,2,2,4,4,5,5]
- // 輸出: [1,2,4,5]
- Array.prototype.s_unique = function() {
- for (var j, m, i=0, k=this.length; i<k; i++, k-=m) {
- for (j=i+1, m=0; j<k; j++, m++) {
- if (this[i]!==this[j]) break;
- }
- this.splice(i, m);
- }
- }
- ///////////////////////////////////////////////////////////////////////////////////////
- //Akira的處理方法,利用Hash
- function UniqueSet()
- {
- this.HashIndex = new Array();
- this.Collection = new Array();
- UniqueSet.prototype.Add = function(obj)
- {
- if (!(obj instanceof Object)) //如果obj不是對象,那么就按照基本數據類型(值類型)的方式處理,注意:可能對DOM無效
- {
- if (this.HashIndex[obj] == null)
- {
- this.HashIndex[obj] = this.Collection.length;
- this.Collection.push(obj);
- }
- }
- else if (obj.UUID != null) //如果對象定義了唯一表識UUID,則用UUID作為索引來處理
- {
- if (this.HashIndex[UUID] == null)
- {
- this.HashIndex[UUID] = this.Collection.length;
- this.Collection.push(obj);
- }
- }
- else
- {
- //對象的處理辦法,利用腳本特性
- if (obj.__UniqueSet_Member_Belongs_To == null)
- obj.__UniqueSet_Member_Belongs_To = new Array();
- for (var i = 0; i < obj.__UniqueSet_Member_Belongs_To.length; i++)
- {
- if (obj.__UniqueSet_Member_Belongs_To[i] == this)
- {
- return;
- }
- }
- obj.__UniqueSet_Member_Belongs_To.push(this);
- this.Collection.push(obj);
- }
- }
- UniqueSet.prototype.toArray = function()
- {
- return this.Collection;
- }
- }
- UniqueSet.parse = function(array)
- {
- array = array.slice(0);
- var uSet = new UniqueSet();
-
- for (var i = 0; i < array.length; i++)
- {
- uSet.Add(array[i]);
- }
- return uSet.toArray();
- }
- function createObjs(size)
- {
- var objList = new Array(); //構造測試數組
- for (var i = 0; i < size; i++) //構造對象(這部分時間不計)
- {
- if (Math.random() > rate)
- {
- item = new Object();
- item.hashCode = Math.random();
- }
- objList.push(item);
- }
- return objList;
- }
- function uniqueTest(objList)
- {
- var test = objList.slice(0); //構造測試副本
- document.write("元素個數:"+test.length+",重復率:"+rate+",開始計時<br/>");
- var startTime = new Date().getTime(); //計時
- test.unique();
- var timeUsed = (new Date() - startTime)/1000;
- document.write("unique()耗時:"+timeUsed+"秒,不重復元素個數"+test.length+"個<br/>");
- }
- function q_uniqueTest(objList)
- {
- var test = objList.slice(0); //構造測試副本
- document.write("元素個數:"+test.length+",重復率:"+rate+",開始計時<br/>");
- var startTime = new Date().getTime(); //計時
- test.q_unique();
- var timeUsed = (new Date() - startTime)/1000;
- document.write("q_unique()耗時:"+timeUsed+"秒,不重復元素個數"+test.length+"個<br/>");
- }
- function uSetTest(objList)
- {
- var test = objList.slice(0);
- document.write("元素個數:"+test.length+",重復率:"+rate+",開始計時<br/>");
- var startTime = new Date().getTime(); //計時
- test = UniqueSet.parse(test);
- var timeUsed = (new Date() - startTime)/1000;
- document.write("uSet()耗時:"+timeUsed+"秒,不重復元素個數"+test.length+"個<br/><br/>");
- }
- //測試開始...
- var rate = 0.1; //元素重復率
- var item = new Object(); //要插入的元素
- item.hashCode = Math.random(); //沒有別的意義,單純的標識
- var objList = createObjs(500); //構造一個500隨機對象的數組
- //下面開始測試排序:
- uniqueTest(objList);
- q_uniqueTest(objList);
- uSetTest(objList);
- objList = createObjs(800); //增加到800對象
- uniqueTest(objList);
- q_uniqueTest(objList);
- uSetTest(objList);
- objList = createObjs(1000); //增加到1000對象
- uniqueTest(objList);
- q_uniqueTest(objList);
- uSetTest(objList);
- document.write("后面因為Aiming的算法速度太慢,而IE提示會影響計時,所以不得不停止測試,僅用我的算法計時<br/>");
- //objList = createObjs(1200); //增加到1200對象
- //uSetTest(objList);
- objList = createObjs(1500); //增加到1500對象
- uSetTest(objList);
- document.write("很奇怪地發現我寫的算法得到的結果和Aiming寫的兩個算法分別得到的結果居然都不一樣??結果:隨便測試了一下...<br/>");
- var testArray = new Array(10,20,30,30,30,40,20,10,4);
- test = testArray.slice(0);
- test.unique();
- document.write("居然檢測出了Aiming的unique()函數的這個錯誤結果:<br/>原始數組:"+testArray+"<br/>結果數組:"+test+"<br/>=.=...汗...<br/>");
- </script>
復制代碼運行代碼另存代碼
應該說,樓主寫的函數從代碼的角度來講,還算是不錯的,但是有下面的一些問題:
1) 沒有保存原始的數組對象,既然改寫(增加)了數組的方法,那么應該保護原始的數組對象,否則的話array.unique()的時候破壞掉了原來的數組。
像array.slice()等系統庫函數這方面就做得比較好,樓主可以參考。
除非樓主是打算做成像array.push()或者array.splice()之類的“寫操作”方法,不過我個人認為將unique方法做成寫方法的話應用價值就打折扣了。
2)方法的效率不是很高,一個簡單的測試如上...大概算到1000數量級的時候就不大行了。我利用腳本語言的特性寫了實現同樣功能的方法,效率會比較高一點。
腳本是解釋型語言,弱點是效率比較低,但是同時也帶來一些靈活的特性(例如動態增加屬性),活用它們可以彌補弱點。
3)一個更為致命的問題是頭兩個方法都有BUG,第三個方法我沒有測試,不知道是否正確。第一個方法(unique())居然連new Array(10,20,30,30,30,40,20,10,4);這樣簡單的Case都沒有通過,建議樓主再修改一下。
最后我要說,腳本語言雖然簡單,然而因為自由,使用起來也有各種復雜的變化。如何發揮它們的優勢,彌補不足,其實這其中的道理并不簡單。
作為程序語言的一種,腳本語言也是“道”的一部分。在求“道”的過程中應當多多深入探索,才會有所領悟,許多東西并不像表面那么簡單。在我看來,樓主的代碼也僅能算做勉強合格(去除BUG之后),所以我想勸樓主收回“精彩”二字以及后面那句話 :P
停止一些浮躁的舉動,靜下心來認真學習和研究,往往會有很多意想不到的收獲。 該評論在 2012/4/23 22:26:54 編輯過
|
|
admin
2012年4月23日 22:25
對了,各位在運行上面那個例子的時候如果IE彈出了運行速度慢的提示的話,那么最后一個(也可能是倒數第二個,具體要看提示框彈出的時間)時間就不準確了...(因為記錄的時間還包括點擊確定按鈕關閉對話框的時間)
其實主要還是因為測試用例動態創建隨機大數組浪費了非常多的時間,如果單獨使用的話,我的算法大概可以跑在高于10000數量級上,如果,數組元素是簡單類型而不是對象的話,還可以再提高一個數量級,但那也不是最好的算法,相信還有很多個優秀的算法實現...
總體來說,javascript是非常自由的...
所以充分發揮想象和創造往往可以獲得“令人驚嘆”的代碼...
如果真正能做到,是非常令人佩服的(那種大牛是月影追求的目標^^)
而能夠欣賞到那樣的代碼也是非常幸運的
因為那也是一種程序界的“藝術”和“美” ^^
|
|
|