| | Vietscholar forum | |  | | 
10-23-2009
|  | Lai vô ảnh, khứ vô hình | | Tham gia ngày: Jun 2009
Bài gởi: 231
Thanks: 7 Thanked 51 Times in 35 Posts Downloads: 0 Uploads: 0 | | Bioinformatics Chào các bác,
Sau vài tháng làm quen với Bioinformatics, bắt đầu từ tuần này em sẽ bắt tay vào làm việc thực sự với nó trong project. Em tiếp cận Bioinformatics từ hướng CS (background của em là CS). Hiện tại em mới đang lọ mọ ở việc đọc background trong 1 số hướng nghiên cứu mà em sẽ phải làm với nhóm mà thôi. Em mở topic này để bác nào cũng làm Bioinformatics thì tham gia nhé. Ban đầu em ngồi nghe và đặt câu hỏi với các bác thôi, còn việc thảo luận chắc phải chờ sau này đủ trình đã. 
Theo lời ông giáo, em nên tham gia cùng lúc 2 project. You should work on 2 projects at the same time. Sometimes you focus on this, sometimes you focus on that. Đại khái ông ấy giải thích là giống như giữ tiền ấy, để chỗ này 1 ít, chỗ kia 1 ít. Em nghe cũng thấy hay, tắc cái này thì chuyển sang cái kia, và ngược lại. Do vậy từ giờ em sẽ nhảy vào cả 2.
Đây là 2 hướng mà em (sẽ phải) quan tâm bây giờ:
1. Designing Gene.
2. Analyzing Microarray Data.
Mời các bác tiếp tục.
thay đổi nội dung bởi: Pisces, 10-23-2009 lúc 06:49 AM | 
12-03-2009
|  | Thành viên dự bị | | Tham gia ngày: Jun 2009
Bài gởi: 4
Thanks: 7 Thanked 0 Times in 0 Posts Downloads: 0 Uploads: 0 | | Các bác làm về Bioinformatics đọc dùm đoạn này với:
-------------------------------------------------------------------------
GAP uses the algorithm of Needleman and Wunsch (1970) J Mol Biol 48:443-453, to find the alignment of two complete sequences that maximizes the number of matches and minimizes the number of gaps. GAP considers all possible alignments and gap positions and creates the alignment with the largest number of matched bases and the fewest gaps. It allows for the provision of a gap creation penalty and a gap extension penalty in units of matched bases. GAP must make a profit of gap creation penalty number of matches for each gap it inserts. If a gap extension penalty greater than zero is chosen, GAP must, in addition, make a profit for each gap inserted of the length of the gap times the gap extension penalty. Default gap creation penalty values and gap extension penalty values in Version 10 of the GCG Wisconsin Genetics Software Package for protein sequences are 8 and 2, respectively. For nucleotide sequences the default gap creation penalty is 50 while the default gap extension penalty is 3. The gap creation and gap extension penalties can be expressed as an integer selected from the group of integers consisting of from 0 to 200. Thus, for example, the gap creation and gap extension penalties can be 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 or greater.
GAP presents one member of the family of best alignments. There may be many members of this family, but no other member has a better quality. GAP displays four figures of merit for alignments: Quality, Ratio, Identity, and Similarity. The Quality is the metric maximized in order to align the sequences. Ratio is the quality divided by the number of bases in the shorter segment. Percent Identity is the percent of the symbols that actually match. Percent Similarity is the percent of the symbols that are similar. Symbols that are across from gaps are ignored. A similarity is scored when the scoring matrix value for a pair of symbols is greater than or equal to 0.50, the similarity threshold. The scoring matrix used in Version 10 of the GCG Wisconsin Genetics Software Package is BLOSUM62 (see, Henikoff and Henikoff (1989) Proc Natl Acad Sci USA 89:10915).
--------------------------------------------------------
2 cái câu mà tôi đánh dấu màu đỏ, đọc mãi vẫn ko hiểu là nó định nói cái gì nữa. Các bác có chuyên môn về cái này giải thích hoặc dịch hộ 2 cái đoạn đánh dấu màu đỏ giúp với!
Thank you! | 
12-04-2009
|  | Trusted member | | Tham gia ngày: Jun 2009
Bài gởi: 27
Thanks: 23 Thanked 11 Times in 10 Posts Downloads: 0 Uploads: 0 | | GAP là một cách đo khoảng cách giữa hai sequences. Bình thường, nếu cứ có một - (substitution) thì cost để align hai sequences được tăng thêm một constant C nào đó. Trong GAP thì các - liên tiếp ( ví dụ --- ) được gom lại thành một 'gap' lớn. Cost để align hai sequence sẽ bao gồm (opening cost = A) + (số '-' tiếp theo) * B (Linear model).
Lấy ví dụ hai sequence:
A- - -B
ABBBB
với opening cost = 3 và cost cho các - tiếp theo là 1 sẽ có cost = 3 + 2 * 1 = 5.
- Quality là total alignment cost between two sequences | Trích: | |  | | | Các bác làm về Bioinformatics đọc dùm đoạn này với:
------------------------------------------------------------------------- GAP must make a profit of gap creation penalty number of matches for each gap it inserts. If a gap extension penalty greater than zero is chosen, GAP must, in addition, make a profit for each gap inserted of the length of the gap times the gap extension penalty. The Quality is the metric maximized in order to align the sequences.
2 cái câu mà tôi đánh dấu màu đỏ, đọc mãi vẫn ko hiểu là nó định nói cái gì nữa. Các bác có chuyên môn về cái này giải thích hoặc dịch hộ 2 cái đoạn đánh dấu màu đỏ giúp với!
Thank you! | | | | | | | I thank gator for this original paper: | | 
12-14-2009
|  | Member | | Tham gia ngày: Sep 2009 Đến từ: Dept of CS,HUT
Bài gởi: 33
Thanks: 13 Thanked 1 Time in 1 Post Downloads: 0 Uploads: 0 | | Em thấy ngành này rất thú vị,em mới học năm 3 về CS ở bkhn cũng không có ý định đi sâu vấn đề này,kiến thức về sinh học thì quên béng hết cả rồi.Em chỉ muốn có 1 chút kiến thức đại cương về vấn đề này thôi :-SS
Anh chị recommend cuốn sách nào để bắt đầu với ngành học thú vị này giúp em được không ạ.
Em xin cảm ơn. | 
12-14-2009
|  | Administrator | | Tham gia ngày: Apr 2009 Đến từ: US
Bài gởi: 143
Thanks: 21 Thanked 71 Times in 39 Posts Downloads: 0 Uploads: 0 | | @Pisces: bác vừa làm 2 project vừa học course ah :-SS. Bác nói rõ hơn là tiếp cận Bioinformatics từ CS là như thế nào vậy bác, vì em thấy nói CS không thì cũng hơi chung chung? Advisor của em cũng bảo take introductory course bên biology nhưng chỉ để nắm được English term & có thể communicate với biologists thôi. | 
01-28-2010
|  | Lai vô ảnh, khứ vô hình | | Tham gia ngày: Jun 2009
Bài gởi: 231
Thanks: 7 Thanked 51 Times in 35 Posts Downloads: 0 Uploads: 0 | | Topic này bị chìm mất đâu đâu, giờ tự nhiên tình cờ đọc lại mới thấy.  | Trích: | |  | | | Em thấy ngành này rất thú vị,em mới học năm 3 về CS ở bkhn cũng không có ý định đi sâu vấn đề này,kiến thức về sinh học thì quên béng hết cả rồi.Em chỉ muốn có 1 chút kiến thức đại cương về vấn đề này thôi :-SS
Anh chị recommend cuốn sách nào để bắt đầu với ngành học thú vị này giúp em được không ạ.
Em xin cảm ơn. | | | | | Nếu ko định đi sâu thì đọc làm gì? 
Còn nếu định đi theo thì có thể đọc cuốn này: ""Molecular Biology of the Gene," James Watson et. al, 5th Edition". bạn google sách, có bản free dưới dạng file djvu (google djvu để dowload chương trình đọc file này). Hình như có phiên bản 6 rồi thì phải. | Trích: | |  | | | @Pisces: bác vừa làm 2 project vừa học course ah :-SS. Bác nói rõ hơn là tiếp cận Bioinformatics từ CS là như thế nào vậy bác, vì em thấy nói CS không thì cũng hơi chung chung? Advisor của em cũng bảo take introductory course bên biology nhưng chỉ để nắm được English term & có thể communicate với biologists thôi. | | | | | Việc tham gia 1 lúc mấy projects là hết sức bình thường mà. Về vấn đề bạn hỏi, mình có trả lời sơ qua bên topic mà bạn gì cũng hỏi tương tự trong chủ đề Biology mới đây. Bạn qua xem nhé.
thay đổi nội dung bởi: Pisces, 01-28-2010 lúc 10:22 AM | 
02-01-2010
|  | Thành viên dự bị | | Tham gia ngày: Dec 2009
Bài gởi: 9
Thanks: 10 Thanked 0 Times in 0 Posts Downloads: 0 Uploads: 0 | | | Trích: | |  | | | Em thấy ngành này rất thú vị,em mới học năm 3 về CS ở bkhn cũng không có ý định đi sâu vấn đề này,kiến thức về sinh học thì quên béng hết cả rồi.Em chỉ muốn có 1 chút kiến thức đại cương về vấn đề này thôi :-SS
Anh chị recommend cuốn sách nào để bắt đầu với ngành học thú vị này giúp em được không ạ.
Em xin cảm ơn. | | | | | Nếu muốn có kiến thức chung chung tổng quan về sinh học thì có thể bắt đầu với cuốn Sinh học của Phillip-Chilton (2 tập). Cuốn này được dịch ra tiếng việt lâu rồi, ở các cửa hàng sách bán nhiều lắm. Học sinh chuyên sinh cấp 3 đều được các thầy cô recommend học cuốn này đầu tiên. Quyển này kiến thức cơ bản. Có một số chỗ sai + dịch hơi củ chuối + thiếu phần giải thích thuật ngữ nhưng nó vẫn bible cho những ai mới bắt đầu.
Nếu muốn đọc ngay bản tiếng anh thì nên đọc cuốn Biology của Campbell and Reece. Cuốn này hay, đầy đủ, màu mè rất đẹp, minh họa dễ hiểu, bọn học sinh đi thi quốc tế phải nắm vững toàn bộ kiến thức trong cuốn này. Trên mạng có bản scan. Em thấy các thầy mua bản quyền và dịch cuốn này từ mấy năm rồi nhưng ko biết bây h đã xuất bản chưa. Cuốn này còn có đĩa CD rất tuyệt, mình có thể nghe narrator đọc các term khó mà nhiều khi không thể tra được ở các từ điển thông thường.
Thông thường em thấy dân Bioinformatics chỉ quan tâm đến Gene, Sequencing... chứ không đụng chạm gì đến Physiology, Morphology, Histology, Immunology... nên khi đọc có thể bỏ qua các phần này.
Còn những quyển như "Molecular Biology of the Cell" hay "Molecular Biology of the Gene" thì sâu hẳn về hóa sinh và sinh học phân tử. Dân chuyên ngành nhiều người còn chưa đọc hết được.
Có 2 branches em thấy liên quan khá nhiều đến toán là Ecology và Evolution. Người ta thường dùng các công thức toán để mô hình hóa sự lây lan của dịch bệnh, tính toán để xem xét quan hệ họ hàng của các loài trong cây chủng loại phát sinh... Nhưng mà do dốt toán nên em chả hiểu gì. | 
02-02-2010
|  | ham zui | | Tham gia ngày: Jun 2009
Bài gởi: 229
Thanks: 80 Thanked 78 Times in 56 Posts Downloads: 0 Uploads: 0 | | | Trích: | |  | | | Em thấy ngành này rất thú vị,em mới học năm 3 về CS ở bkhn cũng không có ý định đi sâu vấn đề này,kiến thức về sinh học thì quên béng hết cả rồi.Em chỉ muốn có 1 chút kiến thức đại cương về vấn đề này thôi :-SS
Anh chị recommend cuốn sách nào để bắt đầu với ngành học thú vị này giúp em được không ạ.
Em xin cảm ơn. | | | | | 1. Ở đâu đó anh thấy chú bảo học chuyên Toán
2. Chú đang học CS
3. Chú quên béng hết kiến thức về sinh học Kết luận: Anh khuyên chú nếu muốn bắt đầu với ngành học thú vị này thì đọc SÁCH GIÁO KHOA SINH HỌC 10, 11, 12.
P/S: đã có lần bác kitte nhắc nhở rồi, nhưng anh thấy chú viết tiếng Việt như shit, đặc biệt là không bao giờ cách ra sau dấu phẩy.
__________________ mdlhvn | 
02-02-2010
|  | Lai vô ảnh, khứ vô hình | | Tham gia ngày: Jun 2009
Bài gởi: 231
Thanks: 7 Thanked 51 Times in 35 Posts Downloads: 0 Uploads: 0 | | Cũng không nhất thiết phải đọc từ đầu. Nếu muốn biết khái niệm 1 cách chung chung thì lên wiki đọc cũng dc. Thường thì dân làm tin sinh học hay quan tâm chủ yếu đến mảng kiến thức về sinh học phân tử, tế bào. Bạn gì đó có thể google wiki khái niệm cơ bản nhất là Central Dogma of Molecular Biology, từ đó đọc lan ra một số khái niệm cơ bản tiếp theo như DNA, RNA, protein cũng như các quá trình chuyển hoá (transfers). Sau đó thì đọc thêm dần dần các khái niệm liên quan (rộng hơn cũng như sâu hơn). Từ từ bạn sẽ có 1 "big picture" của lĩnh vực (chưa nhất thiết phải hiểu sâu sắc).
Khi đã có 1 "big picture" kiểu như trên về sinh học (phân tử) rồi, bạn google tiếp các vấn đề người ta đang quan tâm trong tin sinh học, từ đó chọn 1 (1 số) vấn đề có vẻ "hot" nhất để đọc. Khi đã đi sâu vào 1 vấn đề nào đó trong tin sinh học, nếu thiếu kiến thức về cái gì trong sinh học thì lại đọc thêm. Nghiên cứu là bottom-up mà, ko nhất thiết phải đọc hết tất cả rồi mới làm nghiên cứu. Cuốn "Molecular Biology of the Gene" chẳng hạn, thực ra bạn cũng có thể đọc ngay 1 số phần trong đó dc mà ko nhất thiết phải đọc những cuốn cơ bản trước. Dĩ nhiên là cũng hơi "khó nhằn" 1 chút, nhưng với những kiến thức hoá và sinh còn rơi rớt ở cấp 3 thì vẫn có thể "nuốt" dc cuốn này. Chỉ có điều là tiếng Anh bạn phải tốt tốt tí, và chịu khó học thêm thuật ngữ trong sinh học. Cái nào ko hiểu thì wiki mà đọc, đừng mất công tra từ điển làm gì, ko hiệu quả đâu. Ko nữa thì lên youtube xem các đoạn phim mô tả, trực quan bao giờ cũng dễ hiểu. 
Tiếc là ở VN hầu như chưa có ai làm về cái này, ko thì bạn theo thầy mà làm là tốt nhất. Thực sự cái này rất khó. Tuy rất mới và rất thú vị nhưng nó cũng rất khó. Nên cân nhắc trước khi lao theo.
Nhân đây cũng lưu ý thêm là tin sinh học (bioinformatics) với sinh thống kê (biostatistics) quan tâm đến các vấn đề ko phải lúc nào cũng giống nhau. Cái mà bạn gì nói ở trên dường như dc quan tâm nhiều hơn trong sinh thống kê (hay sinh toán ? - mathematical biology). Còn thuật ngữ sinh học tính toán (computational bilogy) thì rộng hơn (gần như là 1 thuật ngữ bao trùm), bao gồm nhiều lĩnh vực khác nhau tuỳ vào việc dùng các công cụ như thế nào để giải quyết các vấn đề sinh học. Trong đó còn có computational biochemistry và biophysics cũng như nhiều lĩnh vực nữa, trăm hoa đua nở, theo ko kịp. 
Thôi để lúc nào thu thập dc kha khá kiến thức thì viết vài bài tổng quan vậy (như kiểu bác Thi) để giới thiệu cho bạn nào quan tâm, cũng là dịp để mình hệ thống hoá kiến thức.
thay đổi nội dung bởi: Pisces, 02-02-2010 lúc 07:24 PM | 
02-02-2010
|  | Trusted Member | | Tham gia ngày: Aug 2009
Bài gởi: 613
Thanks: 157 Thanked 243 Times in 155 Posts Downloads: 0 Uploads: 0 | | Mọi người cẩn thận với kiểu học qua wiki nhé. Học chơi lớt phớt cho biết thì được, chứ học từ ABC để nghiên cứu thì rất không nên. Một ông thầy mới về trường tớ đã cảnh báo tân sinh viên của mình "You cannot trust wiki. You cannot trust google, either". Do mấy nguồn này là người ta tổng hợp mà viết nên, tuy dùng cũng được nhưng nên dùng để tra cứu thì tốt hơn là làm tài liệu học cho beginner. Dù sao khi tra cứu mình cũng đã biết sơ sơ nó phải thế nào rồi, chỉ không nhớ cụ thể thôi, đúng sai vẫn phân biệt được. Chứ chưa biết gì chẳng may với phải cái không chuẩn mà tin sái cổ thì... Nhưng dù sao trường hợp này vẫn còn ít. Tớ thấy cái nguy hại nhất với trò học bằng wiki là kiến thức không hệ thống. Cứ tưởng đọc lan ra là ổn, là thấy toàn cảnh rồi nhưng thực ra kiến thức mình hổng lỗ chỗ à. Wiki chỉ dành cho người đã biết sơ sơ, đã biết mình cần tra vấn đề gì, còn sách mới là thứ cung cấp cho beginner kiến thức nền cơ bản, dẫn dắt một cách có hệ thống, có logic, tránh được tình trạng người chưa biết mà không tự biết là mình chưa biết để mà tra.
Tớ cũng là người nhảy ngành rẽ ngang, cũng sốt ruột ăn mì ăn liền wiki với google, cuối cùng lãnh đủ, phải lên thư viện mượn sách đọc tử tế.
Tớ đồng ý với md..., tm có thích thì nên đọc sách sinh học lớp 10, 11, 12 trước, nếu cảm thấy mấy quyển sách tiếng Anh kia khó gặm quá đâm nản. Chẳng hiểu sao tớ thấy mấy quyển sách sinh hay wordy lắm, ai tiếng Anh còn yếu chắc rất dễ ngán hoặc hiểu nhầm lung tung. Tớ nghĩ ai cũng có lúc bắt đầu, đọc sách của trẻ con chẳng có gì là nhục cả. Hồi bọn tớ học thi GRE phần quant., mấy anh bên kinh tế đi làm nghiên cứu mấy năm rồi còn đúc kết kinh nghiệm là nếu thi quant. điểm chưa cao thì lấy sách toán lớp 6 ra học, rất chuẩn. Tớ thấy tip đó hơi bị hay, chẳng có gì là buồn cười hay sỉ nhục ở đây hết.
__________________ Happy are those who dream dreams and are ready to pay the price to make them come true To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts. |  | | Latex Maths & Physics Editor ...
| | | |
Ðang đọc: 1 (0 thành viên và 1 khách) | | | | Ðiều Chỉnh | Kiếm Trong Bài | | | |
Posting Rules
| You may not post new threads You may not post replies You may not post attachments You may not edit your posts HTML đang Tắt | | | | |